本节书摘来自华章计算机《r语言数据分析与挖掘实战》一书中的第2章,第2.1节,作者 张良均,云伟标,王路,刘晓勇,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
r语言是一种为统计计算和图形显示而设计的语言环境,是贝尔实验室(bell laboratory)的rick becker、john chambers和allan wilks开发的s语言的一种实现,提供了一系列统计和图形显示工具。它是一套开源的数据分析解决方案,由一个庞大且活跃的全球性研究型社区维护。它具有下列优势:
1)作为一个免费的统计软件,r可运行于多种平台之上,包括windows、unix、macos和linux。
2)r可以轻松地从各种类型的数据源导入数据,包括文本文件、数据库管理系统、统计软件,乃至专门的数据仓库。它同样可以将数据输出并写入到这些系统中。
3)具有较高的开放性,r不仅提供功能丰富的内置函数供用户调用,也允许用户编写自定义函数来扩充功能。
4)r拥有顶尖水准的制图功能。如果希望复杂数据可视化,那么r拥有最全面且最强大的一系列可用功能。
r是一个体系庞大的应用软件,主要包括核心的r标准包和各专业领域的其他包。r在数据分析、数据挖掘领域具有特别优势,本书针对数据分析和挖掘相关的内容采用原理加实战的方式对r相关函数进行介绍。本章主要对r软件的安装,一些数据分析和挖掘相关的包,以及常用函数的使用进行简单介绍。后续的原理章节中,首先介绍数据挖掘分析的相关原理,然后针对每个原理选取r相关函数进行实战演示,使读者不仅对数据挖掘相关原理有比较清晰的认识,同时可以使用本书提供的r相关实例来切实地感受相关数据挖掘原理的精髓。
安装好r后,点击安装目录中bin目录下的rgui.exe启动r,打开如图2-1所示的界面。
