本节书摘来自华章出版社《r语言与数据挖掘最佳实践和经典案例》一 书中的第1章,第1.2节,作者:(澳)yanchang zhao,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
r[r核心开发团队,2012]是一个自由软件,主要用于统计计算和统计制图,它提供了大量的统计和制图工具。r可以简单地通过程序包的形式进行扩展,截至2012年8月1日,cran程序包库中已经收藏了大约4000个程序包。更多关于r的详细介绍可以参考《an introduction to r》(venables et al., 2010)和《r language definition》[r核心开发团队, 2010b],这两本书都可以从cran网站上获取。r已经广泛应用于学术界和工业界。
为了帮助用户更快地找到需要使用的r程序包,cran提供了任务视图(task views),将所有的r程序包按照不同的处理任务组织起来。与数据挖掘相关的几个任务视图是:
机器学习和统计学习。
聚类分析和有限混合模型。
时间序列分析。
多元统计。
空间数据分析。
另一个关于r实现数据挖掘的入门指导是《r reference card for data mining》,它提供了一套完整的用于数据挖掘的r程序包和函数的索引,并根据功能进行分类。
读者想要了解更多关于r的详细信息,可以参考第15章的在线资源。