5月22日,听了刘红云老师的统计课,非常多干货内容,于是整理笔记,对知识点进行梳理。
以下是所有内容的逻辑框架。
1. 首先针对标题,区分两组概念
(1)观测变量 vs. 潜变量
(2)调节效应 vs. 交互作用
2. 基于观测变量的分析:多元回归分析的方法
(1)什么是多元回归分析?
一个因变量与多个自变量间的线性依存关系
(2)两种情况
①两个连续变量
②连续变量与分类变量的交互作用
3. 两个连续变量
step1:对自变量和调节变量做中心化处理
Q1:什么是中心化处理?
将自变量X和调节变量W都减去各自的均值,转化成CX和CM
Q2:为什么要做中心化处理?
中心化后的变量CX与CXCW,CW与CXCW之间的相关降低,这有助于降低交互项(CX*CW)与其他变量(CX、CW)之间的共线性(non-essectial collinearity),回归分析的结果更稳定,也更具有可解释性。
step2:调节效应的分析过程
①中心化(具体过程看step1 Q1)
②计算CXCW交互项
③以Y为因变量,以CX,CM为自变量做回归分析
④以Y为因变量,以CX,CM,CXCW为自变量做回归分析
⑤看运行结果,交互项是否显著
step3:标准化估计需要注意的问题
我们用SPSS时候,我们到底结果是看非标准化系数(蓝色框框)还是标准系数(红色框框)呢?
答案:蓝色框部分
理由:我们要的是ZXZW,而不是ZXW(标准化系数是把X*W标准化了)
step4:简单回归系数的检验
以前我用的很不靠谱的方法就是在Excel画图,看看两条线是不是走势不一样来判定。
其实真正的简单斜率检验:对于调节变量取值高(高于均值一个标准差)或者取值低(低于均值一个标准差),自变量X对因变量Y的回归系数是否等于零?
4. 连续变量与分类变量的交互作用
by虚拟变量
参考文献:
Multiple regression:testing and interpreting interaction
Some Common Myths About Centering Predictor Variables in Moderated Multiple Regression and Polynomial Regression doi:10.1177/1094428111430540
Categorical Variables in Regression Analysis:
A Comparison of Dummy and Effect Coding doi:10.5296/ije.v4i2.1962