《R语言与数据挖掘最佳实践和经典案例》—— 3.4 更多探索

    xiaoxiao2023-09-22  165

    本节书摘来自华章出版社《R语言与数据挖掘最佳实践和经典案例》一 书中的第3章,第3.4节,作者:(澳)Yanchang Zhao,更多章节内容可以访问云栖社区“华章计算机”公众号查看。

    3.4 更多探索

    本节将介绍一些图像,包括3D散布图、等级图、等高图、交互图以及平行坐标。一个3D散布图可以通过scatterplot3d包[Ligges and M鋍hler, 2003]生成(见图3-9)。

    rgl包[Adler and Murdoch,2012]提供了函数plot3d()来支持交互3D散布图。

    热区图是一个数据矩阵的2D展示,可以由R中的函数heatmap()绘制而成。通过下面的代码,我们使用函数dist()计算iris数据中不同鸢尾花的相似度,并且绘制热区图(见图3-10)。

    lattice包[Sarkar,2008]中的函数levelplot()可以绘制等级图(见图3-11),使用函数grey.colors()创建一个γ校正灰色向量,类似的函数rainhow()可以创建一个连续颜色向量。

    等高图可以使用graphics包中的函数contour()和lattice包中的函数filled.contour()绘制(见图3-12)。

    数值矩阵的另一种图像展示是3D曲面图,如图3-13所示,可以使用函数persp()绘制。

    平行坐标为多维数据提供了良好的可视化效果。平行坐标可以通过MASS包中的函数parcoord()和lattice包中的函数parallelplot()绘制(见图3-14和图3-15)。

    ggplot2包[Wickham,2009]支持复杂的图像,对探索数据十分有用。下面给出一个简单的例子(见图3-16)。关于ggplot2包的更多例子可以从http://had.co.nz/ggplot2/上获得。

    相关资源:R语言与数据挖掘(最佳实践和经典案例) 数据集
    最新回复(0)