文章目錄
- 學習目标
- 用LRT進行時程分析
學習目标
用DESeq2讨論時程分析(time course analyses)
用LRT進行時程分析
盡管基因表達的靜态測量很流行,但生物過程的時程捕獲對于反映它們的動态本質是至關重要的,特别是當模式很複雜,而不是簡單的上升或下降時。在處理這類資料時,**似然比檢驗(LRT)**特别有用。我們可以使用LRT來探究一系列時間點之間是否存在顯著差異,并進一步評估在不同樣本類别之間觀察到的差異。
例如,假設我們有一個實驗,觀察随着時間的推移,對兩種不同基因型的小鼠的治療效果。我們可以為我們的“完整模型”使用一個設計公式,該公式将包括我們資料中主要的變異來源:
genotype
,
treatment
,
time
和我們主要感興趣的條件,也就是随着時間的推移處理效果的差異(
treatment:time
)。
注意:這隻是我們假設實驗的示例代碼。您不需要運作此代碼。
full_model <- ~ genotype + treatment + time + treatment:time
為了進行LRT檢測,我們還需要提供一個簡化模型,即完整模型下沒有
treatment:time
:
reduced_model <- ~ genotype + treatment + time
然後,我們可以使用以下代碼運作LRT:
dds <- DESeqDataSetFromMatrix(countData = raw_counts, colData = metadata, design = ~ genotype + treatment + time + treatment:time)
dds_lrt_time <- DESeq(dds, test="LRT", reduced = ~ genotype + treatment + time)
為了了解哪種基因表達模式會被識别為差異表達,我們在下面舉幾個例子。在下面的圖中,x軸是基因表達,y軸是時間。在這個資料集中,每個時間點有兩個樣本,一個經過了某種處理(紅色),另一個沒有經過某種處理(藍色)。
在這張圖中,我們描述了不會被識别為差異表達的基因類型。在這裡,我們觀察到GeneX在時間點之間的表達存在差異,但在處理組之間的表達模式沒有差異。
我們期待LRT傳回的基因表達模式類型是那些随着時間的推移表現出治療效果不同的基因。在下面的例子中,GeneX在兩個處理組中顯示了不同的表達模式。
繼續我們的示例資料集,在運作LRT之後,我們可以使用
padj
< 0.05的門檻值來确定重要基因集。下一步是根據相同的表達模式對這些基因進行分組,我們可以使用
degPatterns()
來完成這項工作。在這裡,你會注意到我們使用了
col
參數,因為我們有兩組,我們在互相比較。
根據資料中存在的共享表達譜類型,然後可以提取與感興趣的模式相關的基因組别,并繼續對每個感興趣的基因組進行功能分析。