基礎理論:
相關分析:描述定量變量間的關系。
pearson相關:變量間的線性相關程度;
spearman相關:衡量分級定序變量間的相關程度;
kendall相關:非參數的等級相關度量。
R語言常用函數:cor(),預設結果為矩陣
cor(mydat,use=,method=) #use 缺失值的處理,method 處理方法
cor(x,y) #可以計算非方形矩陣,x y分别為2個矩陣,相同的行數
相關性的顯著性檢驗,常用函數cor.test(),單次僅比較2個變量,延伸:psych包中的corr.test() 可以計算所有的變量的相關性是否顯著
cor.test(x,y,alternative=,method=) #x y為檢驗相關性的變量
library('psych')
corr.test(mydat)
相關性分析可視化常用包:
corrplot heatmap PerformanceAnalyticslibrary('openxlsx')
library('corrplot')
library('PerformanceAnalytics') #另一個可視化包
mydat<-read.xlsx('aa.xlsx',colNames = T,sheet = 1)
cor<-cor(mydat) # 正常相關性分析
corrplot(cor) #直接出圖 預設圓形顯示

corrplot(cor,method="color",addCoef.col="grey") #用顔色顯示,同時顯示相關系數
corrplot(cor,order = "AOE",type="upper",tl.pos = "d")
corrplot(cor,add=TRUE, type="lower", method="number",
order="AOE",diag=FALSE,tl.pos="n", cl.pos="n")
library('PerformanceAnalytics') #####用于将相關性的分析結果可視化
cor<-cor(mydat,method = "pearson")
chart.Correlation(mydat,histogram = TRUE,pch=15) ####各種參數可以根據個人需要調整