基础理论:
相关分析:描述定量变量间的关系。
pearson相关:变量间的线性相关程度;
spearman相关:衡量分级定序变量间的相关程度;
kendall相关:非参数的等级相关度量。
R语言常用函数:cor(),默认结果为矩阵
cor(mydat,use=,method=) #use 缺失值的处理,method 处理方法
cor(x,y) #可以计算非方形矩阵,x y分别为2个矩阵,相同的行数
相关性的显著性检验,常用函数cor.test(),单次仅比较2个变量,延伸:psych包中的corr.test() 可以计算所有的变量的相关性是否显著
cor.test(x,y,alternative=,method=) #x y为检验相关性的变量
library('psych')
corr.test(mydat)
相关性分析可视化常用包:
corrplot heatmap PerformanceAnalyticslibrary('openxlsx')
library('corrplot')
library('PerformanceAnalytics') #另一个可视化包
mydat<-read.xlsx('aa.xlsx',colNames = T,sheet = 1)
cor<-cor(mydat) # 常规相关性分析
corrplot(cor) #直接出图 默认圆形显示

corrplot(cor,method="color",addCoef.col="grey") #用颜色显示,同时显示相关系数
corrplot(cor,order = "AOE",type="upper",tl.pos = "d")
corrplot(cor,add=TRUE, type="lower", method="number",
order="AOE",diag=FALSE,tl.pos="n", cl.pos="n")
library('PerformanceAnalytics') #####用于将相关性的分析结果可视化
cor<-cor(mydat,method = "pearson")
chart.Correlation(mydat,histogram = TRUE,pch=15) ####各种参数可以根据个人需要调整