假設調查人員有興趣檢查減肥幹預方法的三個組成部分。這三個組成部分是:
- 記錄食物日記(是/否)
- 增加活動(是/否)
- 家訪(是/否)
調查員計劃調查所有
,實驗條件的組合。實驗條件為
- 要執行因子設計,您需要為多個因子(變量)中的每一個選擇固定數量的水準,然後以所有可能的組合運作實驗。
- 這些因素可以是定量的或定性的。
- 定量變量的兩個水準可以是兩個不同的溫度或兩個不同的濃度。
- 定性因素可能是兩種類型的催化劑或某些實體的存在和不存在。
符号
: - 因子數 (3) - 每個因子的水準數 (2) - 設計中有多少實驗條件 (
)
因子實驗可以涉及具有不同水準數量的因子。
測試:
考慮一個
設計。
- 有多少因素?
- 每個因素有多少個水準?
- 多少實驗條件(運作)?
答案:
(a) 有 2+2+1 = 5 個因數。
(b) 兩個因素有4個水準,2個因素有3個水準,1個因素有2個水準。
(c) 有 288 個實驗條件。
方差分析和因子設計之間的差別
在 ANOVA 中,目标是比較各個實驗條件。
讓我們考慮一下上面的食物日記研究。
我們可以通過比較食物日記設定為 NO(條件 1-4)的所有條件的平均值和食物日記設定為 YES(條件 5-8)的所有條件的平均值來估計食物日記的效應。這也被稱為食物日記的 主效應 ,形容詞 主要 是提醒這個平均值超過了其他因素的水準。
食物日記的主要作用是:
體育鍛煉的主要作用是:
家訪的主要作用是:
使用了所有實驗對象,但重新排列以進行每次比較。受試者被回收以測量不同的效應。這是析因實驗更有效的原因之一。
執行 因子設計
要執行因子設計:
- 為每個因子選擇固定數量的水準。
- 以所有可能的組合運作實驗。
我們将讨論每個因子隻有兩個水準的設計。因素可以是定量的或定性的。兩個水準的定量變量可以是兩個不同的溫度或濃度。定量變量的兩個級别可以是兩種不同類型的催化劑或某些實體的存在/不存在。
一項實驗采用 2^3 因子設計,具有兩個定量因素 - 溫度 (T) 和濃度 (C) - 以及一個定性因素 - 催化劑 K 類型。
溫度T(C∘)有兩個等級:160C∘和180C∘。它們分别編碼為 -1 和 +1。
濃度 C (%) 有兩個級别:20 和 40。它們分别編碼為 -1 和 +1。
催化劑 K 有兩個級别:A 和 B。它們分别編碼為 -1 和 +1。
記錄的每個資料值都是針對兩次重複運作的平均因變量産量 y。
立方圖
下圖顯示了立方體角處因子 T、C 和 K 的各種組合的 y 值。例如,當 T=-1、C = 1 和 K=-1 時,從運作 3 獲得 y=54。
- 立方體展示了這種設計如何沿着立方體的 12 個邊緣進行 12 次比較:溫度變化影響的四個測量值;濃度變化影響的四種測量方法;催化劑變化效應的四種測量方法。
- 在立方體的每條邊上,隻有一個因子發生變化,而其他兩個因子保持不變。
- bh4 <- lm
- Plot
因子效應
主要影響
運作 1 和 2 的影響僅因溫度而不同,因為濃度為 20%,催化劑類型為 A。差異 72-60 = 12 提供了一種溫度影響的測量值,而其餘因素保持不變。對于濃度和催化劑的四種組合中的每一種,有四種這樣的溫度效應測量方法。
T 的主要(平均)影響是
有一組類似的濃度 C 測量值。在這些測量值中的每一個中,水準 T 和 K 都保持不變。濃度 C 的主要影響是:
C的主要(平均)影響是
K 的主要影響是
K 的主要(平均)影響是
所有 8 次運作都用于估計每個主效應。這就是因子設計比一次檢查一個因子更有效的原因。
一般來說,主要影響是兩個平均值之間的差異:
其中 ¯y+ 是對應于因子 +1 水準的平均響應,而 ¯y− 是對應于因子 -1 水準的平均響應。
互動效應
兩因素互相作用
當催化劑 K 為 A 時,溫度效應為:
當催化劑 K 為 B 時,溫度效應為:
這兩個平均差異之間的平均差異稱為溫度和催化劑之間的 互相作用 ,用 TK 表示。這就是溫度和催化劑兩個因素之間的互相作用——溫度和催化劑之間的兩個因素互相作用。
這也可以在立方圖上看到:與立方體正面 (13) 相比,立方體 (33) 背面的平均溫度影響更大。
三因素互相作用
當催化劑為 B(在其 +1 水準)時,濃度互相作用的溫度為:
當催化劑為 A(在其 -1 水準)時,濃度互相作用的溫度為:
這兩種互相作用之間的差異衡量了兩種催化劑的溫度-濃度互相作用的一緻性。這種差異的一半被定義為溫度、濃度和催化劑的三因素互相作用,用 TCK 表示。
因子設計中的複制
工廠實驗的結果 y是兩次重複運作的平均值。兩個單獨的運作如下表所示。運作順序是随機的。例如,運作 6 和 13 是 T、C 和 K(T=-1、C=-1、K=-1)的相同設定下的兩個仿行。
複制運作并不總是可行的。工廠實驗運作包括清潔反應器,插入适當的催化劑裝料,并在給定的進料濃度下在給定的溫度下運作裝置 3 小時,以使過程在所選的實驗條件下穩定下來,以及 (4) 取樣在運作的最後幾個小時内每 15 分鐘輸出一次。
假設每次測量的方差為 σ2。每組條件下的估計方差為:
其中 yi1 是第 i 次運作的第一個結果。在上表中diffi=(yi1−yi2)。σ2 的彙總估計是
對于重複運作,具有一個自由度的方差估計為
. 這些産生單自由度估計的平均值産生具有 8 個自由度的合并估計 s2=8。
重複運作效應的誤差方差和标準誤差的估計
每個估計的效應,例如 T、C、K、TC 等,都是 8 個觀測值的兩個平均值之間的差異。重複運作的因子效應方差為
是以,任何因子效應的标準誤為:
結果解釋
哪些影響是真實的,哪些可以偶然解釋?一個粗略的經驗法則是,任何 2-3 倍于其标準誤差的效應都不容易僅靠偶然性來解釋。
如果我們假設觀測值是獨立且正态分布的,那麼
是以,95% 的置信區間可以計算為:
其中 t8,.05/2 是 t8t 的第 97.5 個百分位數。這是通過
qt()
函數在 R 中獲得的。
qt(p = 1-.025,df = 8)
是以,因子效應的 95% 置信區間為
T 的 95% 置信區間為
K 的 95% 置信區間為
1.5-3.2 #下限
## [1] -1.7
1.5+3.2 #上限
## [1] 4.7
溫度的影響可能不是偶然的,但偶然不能成為催化劑的影響的規則。
隻有在沒有證據表明該因素與其他因素互相作用時,才應單獨解釋一個因素的主效應。
互動圖
下圖顯示了每對因子 TC、TK、CK(即這些因子的每個因子水準組合)的平均産量。這些圖通常稱為互動圖。如果兩條線平行,則表明沒有互相作用,如果兩條線交叉或接近交叉,則表明可能存在互相作用。
下圖顯示了催化劑和溫度之間的雙向互相作用。
plot(tabT,taC,ty, type = "l")
2k 因子設計的線性模型
yi 是第 i 次運作的結果,
2^3 因子設計的線性模型是:
變量
是溫度和濃度之間的互相作用,xi1xi3xi1xi3 是溫度和催化劑之間的互相作用等。
參數估計是通過
lm()
R 中的函數獲得的。
- fact.mod <-lm(y~T*K*C,data = tab0503)
- round(summary(fact.mod)$coefficients,2)
設計矩陣
設計是:
這個模型矩陣
設計是:
model.matr
下表顯示了具有因變量的模型矩陣:
如果将 T 的列乘以平均收益率并除以 4,則得到 T 的主效應。
估計的最小二乘系數是因子估計的二分之一,截距 β0 是樣本均值。是以,因子估計是最小二乘系數的兩倍。例如,
- 4 的除數将對比度轉換為兩個平均值之間的差異。
- 通過乘以各自因素的辨別獲得互動作用對比。
- 每列相對于其他列完全平衡(正數和負數相等)。
- 平衡(正交)設計確定每個估計的效應不受其他效應的大小和辨別的影響。
最小二乘估計可以在 R 中乘以 2。
- fad <-lm
- round(2*coeffits,2)
當有重複運作時,我們還從回歸模型中獲得因子效應的 p 值和置信區間。例如,β1 的 p 值對應于溫度的階乘效應
如果原假設為真,那麼
為了獲得因子效應的 95% 置信區間,我們将回歸參數的 95% 置信區間乘以 2。這在 R 中使用函數 很容易做到
confint()
。
2*confint.lm
濃度主效應的 95% 置信區間為 (-8.0,-1.5),溫度和濃度之間的雙向互動作用具有 95% 置信區間 (-1.46,4.96)。
因子設計相對于一次一個因子設計的優勢
假設一次隻研究一個因素。例如,在将濃度保持在 20% (-1) 并将催化劑保持在 B (+1) 時研究溫度。
為了使效應具有更普遍的相關性,有必要使效應在所有其他濃度和催化劑水準上都相同。換句話說,因素(例如,溫度和催化劑)之間沒有互相作用。如果效應相同,則因子設計更有效,因為效應的估計需要更少的觀察來達到相同的精度。
如果在其他濃度和催化劑水準下效應不同,則階乘可以檢測和估計互相作用。
非重複因子設計中的正态圖
回顧正态分位數圖
一組資料的正态性可以通過以下方法來評估。讓
表示的有序值
. 例如,r(1) 是 r1,...,rN 的最小值,r(N) 是 r1,...,rN 的最大值。是以,如果資料是:-1, 2, -10, 20, 那麼
。
N(0,1)的累積分布函數 (CDF) 具有 S 形。
- x <- seq
- plot(x,pnorm)
是以,一組資料的正态性檢驗是繪制資料的有序值 r(i) 與 pi=(i-0.5)/N 的關系。如果該圖與正态 CDF 具有相同的 S 形,則這表明資料來自正态分布。
下面是從圖中模拟的 1000 個随機樣本的 r(i) 與 pi=(i−0.5)/N,i=1,...,N 的關系圖
- N <- 1000
- x <- rnorm(N)
- p <- ((1:N)-0.5)/N
- plot
我們還可以建構一個正态的分位數-分位數圖。可以證明 Φ(r(i))Φ(r(i)) 在 [0,1] 上具有均勻分布。這意味着 E(Φ(r(i)))=i/(N+1)(這是來自 [0,1] 上的均勻分布的第 i 階統計量的期望值。
這意味着 N 點 (pi,Φ(r(i))) 應該落在一條直線上。現在将 Φ−1 變換應用于水準和垂直尺度。N個點
形成正态機率圖
. 如果
是從正态分布生成的,然後是點圖
應該是一條直線。
在 R
qnorm()
中是 Φ-1。
- plot(qnorm(p),sort(x))
我們通常使用内置函數
qqnorm()
(并
qqline()
添加一條直線進行比較)來生成 QQ 圖。請注意,R 使用稍微更通用的分位數版本 (pi=(1−a)/(N+(1−a)−a),其中 a=3/8,如果 N≤10,a=1/2,如果N>10。
qqnorm(x);qqline(x)
該圖與直線的顯着(系統性)偏差表明:
- 正态假設不成立。
- 方差不是恒定的。
一個主要應用是在因子設計中,其中 r(i) 被有序因子效應代替。設 ^θ(1)<^θ(2)<⋯<^θ(N) 為 N 個有序因子估計。如果我們繪制
那麼接近 0 的階乘效應 ^θi 将沿直線下降。是以,偏離直線的點将被宣布為重要點。
基本原理如下: 1. 假設估計效應 ^θi 為 N(θ,σ)(估計效應涉及 N 個觀測值的平均值,CLT 確定 N 小至 8 的平均值接近正态)。2. 如果 H0:θi=0,i=1,...,N 為真,那麼所有估計的影響都将為零。3. 估計效應的結果正态機率圖将是一條直線。4. 是以,正态機率圖是檢驗所有估計的效應是否具有相同的分布(即相同的均值)。
- 當一些效應不為零時,相應的估計效應将趨于更大并偏離直線。
- 對于正面影響,估計的影響落在該線之上,而負面影響落在該線之下。
示例 - 研究化學反應的設計
一個工藝開發實驗研究了四個因素
因子設計:催化劑裝料量 1、溫度 2、壓力 3和其中一種反應物的濃度 4。因變量 y 是 16 個運作條件中每個條件下的轉化百分比。該設計如下圖所示。
該設計未重複,是以無法估計因子效應的标準誤差。
fct1 <- lm
可以獲得因子效應的正态圖 。
Plot(fac
對應的效應
x1, x4, x2:x4, x2
不會沿着直線下降。
半正态圖
相關的圖形方法稱為半正态機率圖。讓
表示無辨別因子效應估計的有序值。
根據半正态分布的坐标繪制它們 - 正态随機變量的絕對值具有半正态分布。
半正态機率圖由點組成
該圖的一個優點是所有較大的估計效應都出現在右上角并落在該線之上。
可以獲得過程開發示例中效應的半正态圖
half = TRUE
。
Lenth 方法:檢驗沒有方差估計的實驗的顯着性
半正态圖和正态圖是涉及視覺判斷的非正式圖形方法。最好根據正式的顯着性檢驗來定量地判斷與直線的偏差。
在 2k設計 N=2k-1 中估計 θ1,θ2,...,θN的因子效應。假設所有因子效應具有相同的标準差。
僞标準誤差 (PSE) 定義為
其中中位數是在 ∣∣^θi∣ 中計算的
和
估計的因子效應為:
ef <- 2*fat1$coeffic
s0=1.5⋅median∣∣^θi∣∣的估計是
- s0 <- 1.5*median(abs(eff))
- s0
修整常數 2.5s0 是
2.5*s0
∣∣^θi∣∣≥2.5s0 的效應 ^θi 将被修剪。下面是标記為
TRUE
(
x1,x2,x4,x2:x4
)的效應
abs(eff)<2.5*s0
然後将 PSE 計算為這些值中位數的 1.5 倍。
- PE <- 1.5*median
- PE
ME 和 SME 是
- ME <- PE*qt
- ME
PE*qt(p =(1+.95^{1/15})/2,df=(16-1)/3)
是以,效應的 95% 置信區間為:
- lor <- round(ef-ME,2)
- uper <- round(ef+ME,2)
- kable(cbind)
具有 MEME 和 SME 的效應圖通常稱為 Lenth 圖。PSE,ME,SMEPSE,ME,SME 的值是輸出的一部分。下圖中的尖峰用于顯示因子效應。
Plot(fat1,cex.fac = 0.5)