天天看點

R語言和大資料MaxCompute産品位址:https://www.aliyun.com/product/odps安裝R語言安裝RStudio登陸通路最新進展

r3.3版本會出現各種so不存在的問題,退回去到r3.1版本時候就順利安裝。

在安裝r環境之前,先安裝好中文(如果沒有的話圖表中顯示漢字成框框了)和tcl/tk包(少了這個沒法安裝sqldf)

sudo yum install fonts-chinese tcl tcl-devel tclx tk tk-devel -y

安裝中文字型後重新加載 service xfs reload (不過在有台機器上總是失敗,後來重新開機機器ok)

sudo service xfs reload

有些包會需要rgl,調用opengl的庫,是以還要安裝opengl包

sudo yum install mesa-libglu mesa-libglu-devel -y

sudo yum install gcc-gfortran gcc gcc-c++ readline-devel libxt-devel -y

tar xvf r-3.1.0.tar.gz

./configure --enable-r-shlib=yes --enable-blas-shlib=yes --with-lapack --with-libpng --with-x=no --with-tcltk

sudo sh -c "make"

sudo sh -c "make install"

sudo r cmd javareconf java_home=$java_home

進入到r中進行

install.packages('rjava')

選擇22

安裝dbi

install.packages("dbi")

安裝rsqlite

install.packages("rsqlite")

配置 odps_config.ini 

 project_name=myproject

 access_id=<這裡輸入access id,不帶尖括号>

 access_key=<這裡輸入access key,不帶尖括号>

 end_point=http://service.odps.aliyun-inc.com/api

驗證

sys.getenv('rodps_config');

最後安裝rodps包

r裝在工作的筆記本電腦上,由于記憶體的限制,隻能用于一些很小的資料集的分析,是以更好的方式是,在linux上配置一個r加rstudio-server,然後可以通過web直接通路r的功能。

下載下傳rstudio-server的rpm包安裝即可

rpm -ivh --nodeps rstudio-server-0.97.551-x86_64.rpm

啟動指令

坑爹的是啟動失敗并沒有任何錯誤提示,在/var/log/messages找到錯誤資訊

安裝時如果提示缺少libr.so;使用make unsintall解除安裝,然後重新安裝一次r,指定了enable-r-shlib以後就不再報錯。

啟動正常以後ps aux能夠看到/usr/lib/rstudio-server/bin/rserver 

就說明已經啟動了

配置檔案位于/etc/rstudio/rserver.conf

www-port=80,80是預設的http服務端口号。

rsession-ld-library-path=/opt/local/lib:/opt/local/someapp/lib 指定額外的庫位址

rsession-which-r=/usr/local/bin/r 指定r軟體位置

auth-required-user-group=rstudio_users 限制可登陸r使用者

rsession-memory-limit-mb=4000 限制使用的最大記憶體

rsession-stack-limit-mb=10 限制最大的棧大小

rsession-process-limit=100 限制最多程序數

session-timeout-minutes=30 程序逾時時間

r-libs-user=~/r/packages 設定預設的r包 

limit-file-upload-size-mb=100 設定最大的上傳檔案大小

打開localhost測試位址;

此外,還需要設定環境變量才可以通路,使用下面指令設定目前session的環境變量

sys.setenv(rodps_config ="odps_config.ini")

library('rodps_config')

如下圖

R語言和大資料MaxCompute産品位址:https://www.aliyun.com/product/odps安裝R語言安裝RStudio登陸通路最新進展

r還是把資料load到本地進行計算的,這樣的方式在大資料時代多少顯得落伍。目前r和hadoop結合的有rhadoop、rhive、rhbase、sparkr等等,rhive和rodps采用的方法是類似的,用lib結合接口進行通路。比較徹底的是sparkr,在api和運作時做了修改。使用r或python的dataframe api能獲得和scala近乎相同的性能。

調用maxcompute資料方面,可以先把語言轉換為sql腳本在調用。

文章轉自xiamingchao

歡迎加入“數加·maxcompute購買咨詢”釘釘群(群号: 11782920)進行咨詢,群二維碼如下:

R語言和大資料MaxCompute産品位址:https://www.aliyun.com/product/odps安裝R語言安裝RStudio登陸通路最新進展

繼續閱讀