本节书摘来异步社区《机器学习与数据科学(基于r的统计学习方法)》一书中的第1章,第1.8节,作者:【美】daniel d. gutierrez(古铁雷斯),更多章节内容可以访问云栖社区“异步社区”公众号查看。
r以一种非常积极的方式拥抱开源,通过使用所谓的“包”来扩展软件的基本功能。有大量的通用包(当前大约是7000个),其中很多涉及有用的统计方法,也有特定领域的包:金融、天文学、分子生物学、生态学等。你可以用下面给出的r脚本来找到当下可用的r包数目:
r包贡献在综合r归档网(cran,the comprehensive r archive network)中,这是一个由世界各地的专家维护的资源库。为了找到离你地理位置最近的cran镜像,请访问www.r-project.org,点击cran链接,选择你的国家/位置。在那里,你可以看到一页按名称排列的可用cran包。这个网页非常长,所以你需要使用浏览器的find工具来通过关键词来搜索。例如,有6个r包的名字中含有关键词“金融(finance)”。也有一些在cean上找不到的私有r包,你可以用谷歌来查找并下载安装到你本地配置中。
一旦找到了满足你需求的r包,你需要在本地配置中安装它。例如,这是安装lubridate包的命令:
一个包只能安装一次。安装完成后,你需要做的是用library()把它加载到内存中。library()函数用来加载基础r配置中未包括的函数库(函数和数据集的集合)。