大家好,作為一名因為很懶是以一直收藏了很多花裡胡哨的小技能的“小菜雞”,今天我來跟大家一起聊聊一篇學員在訓練營給的疾病互動的文(Tao)章(Lu)。2017年發表在Journal of cellular Physiology, IF4.5。題目是:The key genes underlying pathophysiology association between the type 2-diabetic and colorectal cancer,一篇2型糖尿病與結直腸癌互動的生信文章(是不是感覺有點小清新)。

首先來看一下題目,疾病是2型糖尿病與結直腸癌,兩個疾病的互動,目的是找到兩個疾病病理生理相關的關鍵基因(應該就是疾病互動的共同hub基因)。文章比較簡單,作者篩選出key基因之後,在一個用了二甲雙胍的資料集中簡單分析了下key基因在用藥組和對照組中表達量的差異,文章勉強做到了“挑、圈、連、靠”四字神功,好了,我們接着往下看!
資料準備:文章從GEO下載下傳了4個資料集,其中GSE21510和GSE8671是惡性良性腫瘤資料集(結直腸癌CRC),GSE55650是2型糖尿病資料,GSE67342是進行了二甲雙胍處理的結直腸組織樣本和3個結直腸癌癌細胞系對照樣本,所有樣本均來自GPL570平台(畫重點,人家是同個平台的資料喔)。
(Figure 1)
挑:作者進行背景校正之後,使用t-test進行差異表達分析,并使用Venn圖展示2型糖尿病和結直腸癌資料集中的差異基因。其中,DEGs1代表糖尿病和大腸癌表達轉錄本中都上調的基因;DEGs2在糖尿病轉錄本中表達上調的基因,而在大腸癌轉錄本中表達下調的基因,DEGs3代表糖尿病和大腸癌表達轉錄本中都下調的基因。DEGs4在糖尿病轉錄本中表達下調的基因,而在結直腸癌轉錄本中表達上調的基因(關于Venn圖我在後文放了個連結給大家,線上輕松取交集,沒辦法,懶嘛)。
(Figure 2)
圈:作者對糖尿病和CRC中獨立的414個DEGs進行了KEGG富集分析(其實就是DEGs2和DEGs4)。結果表明,144個在CRC中下調而在糖尿病中上調的基因(DEGs2)主要富集在免疫相關途徑中,如自然殺傷細胞介導的細胞毒作用、溶酶體以及抗原處理和提呈途徑。在CRC中表達上調,在糖尿病中表達下調的270個基因(DEGs4)主要在RNA降解、RNA轉運和核糖體等遺傳資訊進行中富集。而作者發現,富集到的核糖體途徑與5-氟尿嘧啶耐藥相關,這與惡性良性腫瘤的高增殖性能一緻(Kimura et al., 2010)(沒錯,這部分就結束了,也不說啥了)。
(Figure 3)
連:作者為了了解二甲雙胍在糖尿病和結直腸癌治療中的作用,利用Drug Repurposing Hub database中的二甲雙胍靶基因以及DEGs1和DEGs3中的基因進行網絡分析。編碼蛋白PRKAB1和ACACB是PPI網絡中的二甲雙胍靶基因。而這兩個靶基因與其餘7個HUB基因(HADHB、NDUFS3、TAF1、MYC、HNFF4A、ATP5O和MAX)存在顯著互作。提示這7個基因在二甲雙胍治療糖尿病和結直腸癌的過程中也起着重要作用(道理我都懂,但是為啥前面不用DEGs1和DEGs3做富集分析呢?)。
(Figure 4)
靠:作者不是還找了一個二甲雙胍處理過的資料集嗎?這裡派上用場了,使用直方圖展示了這7個Hub基因在二甲雙胍治療組和對照組中的表達差異,方法用的還是t檢驗。結果顯示,7個hub基因中的6個(包括HADHB、NDUFS3、TAF1、MYC、HNFF4A和MAX)在使用二甲雙胍處理人CRCLOVO細胞系後,其表達值發生了顯著變化(p<0.05)。這進一步增加了這六個基因在二甲雙胍治療糖尿病和CRC過程中發揮重要作用的可信度。
最後這個文章就結束了。是不是有點懵?是不是覺得不應該啊,應該還要有點後續才行啊,但是,很可惜,作者真的到這裡就結束了。其實也很正常,大家看一看文章發表的時間,2017年。什麼概念?2017年的時候可能很多人都不知道生信結果可以拿來獨立發文呢?那時候也沒各種線上資料庫和複雜的算法,而作者已經想到用疾病互動來進行生信分析了,這要是不能發才怪呢O(∩_∩)O 不過這也給非惡性良性腫瘤研究的學員提供了一個新思路:我不是研究惡性良性腫瘤,那我可以和惡性良性腫瘤靠個邊一起分析一下總行吧?我覺得至少研究代謝性疾病的學員可以嘗試一下,例如 肥胖?
現在檢索一下Pubmed發現其實這種疾病互動的文章也不多,我猜可能是因為這種文章後續不好繼續分析,當然啦,在訓練營裡也跟學員們探讨了如果要加一些資料和圖表該怎麼分析,這裡就不展開啦。文章放在公衆号,背景回複“小菜雞01”,就可以得到文章全文啦。訓練營還有學員提到了一個問題,這樣的文章臨床意義在哪裡呢?emmmm,你品,你細品!