R語言惡性良性腫瘤純度評估二

我們前面介紹了惡性良性腫瘤中如何進行反卷積純化惡性良性腫瘤組織表達矩陣，今天我們介紹一個作為R包DeMixT子功能另一個R包estimate(Estimation of STromal and Immune cells in MAlignant Tumor tissues usingExpression data)。

它主要的功能是在不借助參考資料的情況下可以對惡性良性腫瘤組織中的基質以及免疫侵潤進行打分。接下來我們介紹下這個包是怎麼使用的：

首先就是包的安裝，我們需要用到下面的安裝代碼以及安裝源：

library(utils)
rforge <-"http://r-forge.r-project.org"
install.packages("estimate",repos=rforge, dependencies=TRUE)

複制

安裝完之後就是惡性良性腫瘤純度的計算了，在這裡我們用到的是包自帶的卵巢癌的資料。首先是資料的載入：

library(estimate)
OvarianCancerExpr <-system.file("extdata", "sample_input.txt",package="estimate")
read.table(OvarianCancerExpr)[1:4,1:4]

複制

接下來就是對基因的統一化：

filterCommonGenes(input.f=OvarianCancerExpr,output.f="OV_10412genes.gct",
                  id="GeneSymbol")

複制

結果中會展示我們歸一化後的基因數目。

接下來就是評估打分函數的引入，再次多說一句：由于不同的平台基因數目的不一緻，是以我們需要選擇對應的平台進行資料評估，其中包括了以下參數：platform = c("affymetrix", "agilent", "illumina")，執行個體如下：

複制

estimateScore(input.ds ="OV_10412genes.gct",output.ds="OV_estimate_score.gct",
              platform="affymetrix")#platform預設是affymetrix。

複制

至此我們得到了我們想要的評估分數，我們還可以對其中的某個或者所有的樣本進行可視化，我們就以一個樣本為例：

plotPurity(scores="OV_estimate_score.gct",samples="s516", platform="affymetrix")#預設就是對所有樣本繪制圖形，圖形将儲存至工作目錄的estimated_purity_plots檔案夾。

複制

上圖展示的就是評估分數和惡性良性腫瘤純度的一個一一對應的散點圖。也就是打分越小純度越高。

當然我們可以直接對我們最後的結果進行讀出并提取我們想要的資料：

scores=read.table("OV_estimate_score.gct",skip= 2,header = T)
head(scores)

複制

圖中我們可以看到，資料分為四行分别是基質，免疫，綜合打分以及惡性良性腫瘤純度。其純度方程式我們也找到了，其實很簡單就是餘旋函數：