天天看點

不慌,遇到不同類型的單細胞測序檔案讀取看過來

作者:雲生信學生物資訊學

爾雲間 一個專門做科研的團隊

原創 小果 生信果

歡迎點贊+收藏+關注[給你小心心]

不慌,遇到不同類型的單細胞測序檔案讀取看過來

單細胞不同類型測序檔案讀取

在進行單細胞資料分析時,第一步就是單細胞測序檔案的讀入,單細胞檔案形式各種各樣

今天小果講解一下幾種不同類型檔案的讀入方法,方法如下:

10X的單細胞檔案

#讀取資料10X資料所在的檔案夾
pbmc.data <- Read10X(data.dir = "filtered_gene_bc_matrices/hg19/")           
不慌,遇到不同類型的單細胞測序檔案讀取看過來
#建立Seurat檔案
pbmc <- CreateSeuratObject(counts = pbmc.data, project = "pbmc3k", min.cells = 3, min.features = 200)           

輸入資料是基于UMI的表達矩陣(其中資料集中的行表示基因,清單示細胞)

molecules <- read.delim("molecules.txt",header = TRUE,
row.names = 1)           
不慌,遇到不同類型的單細胞測序檔案讀取看過來
#建立Seurat檔案
obj <- CreateSeuratObject(counts = molecules,
min.cells = 3, #篩選至少在3個細胞中表達的基因
min.features = 200) #篩選至少有200個基因表達的細胞
#增加Seurat的元資訊(metadata)
ann <- read.delim("annotation.txt", header = TRUE)           
不慌,遇到不同類型的單細胞測序檔案讀取看過來
rownames(ann) <- ann$sample_id
obj <- AddMetaData(obj, ann)           

輸入資料是h5檔案格式

devtools::install_github(repo = "hhoeflin/hdf5r")
library(hdf5r)
obj<-Read10X_h5("GSE154989_mmLungPlate_fQC_dSp_rawCount.h5")
obj <- CreateSeuratObject(counts = obi, project=”obj”,
min.cells = 3, #篩選至少在3個細胞中表達的基因
min.features = 200) #篩選至少有200個基因表達的細胞           

利用SeuratData包導入内置資料

devtools::install_github('satijalab/seurat-data',force = TRUE)
library(SeuratData)
InstallData("ifnb")
LoadData("ifnb")           

Seurat對象

如果檔案是已經建構好的seurat對象,後期可以直接進行質控和單細胞分析流程;如果發現發現上傳seurat版本較低,需要更新轉化。

obj<-UpdataSeuratObject(object=obj)

單細胞測序檔案類型大概就這幾種,在進行資料讀入時可以按照資料類型選擇不同的方法進行讀取。

不慌,遇到不同類型的單細胞測序檔案讀取看過來

今天小果的分享就到這裡,有需要的可以點贊收藏加個關注奧,下期再見奧!!!

往期代碼:

【1】lncRNA的拷貝數變異下遊相關分析

【2】R可視化:ggstatsplot包—科研界的美圖秀秀

【3】随機森林算法用于分類預測和篩選診斷标志物

【4】基于本地Java版GSEA的輸出結果整合多個通路到一張圖

【5】基于嶺回歸模型和基因表達矩陣估算樣本對藥物反應的敏感性

【6】基于R包NMF對樣本進行分型分析

【7】DALEX包用于探索、解釋和評估模型;分析不同特征變量對響應變量的影響

【8】根據惡性良性腫瘤突變負荷TMB進行KM生存分析尋找最佳的cutoff

【9】基于單樣本富集分析算法評估組織中的免疫細胞浸潤水準

【10】代碼分享│什麼?你還在用散點圖來可視化資料之間的相關性

【11】代碼分享│診斷列線圖、校準曲線、決策曲線和臨床影響曲線的建構

【12】代碼分享│你了解基因的動态變化模式嗎

【13】代碼分享│生物資訊分析之SCI熱門圖表-複雜熱圖

【14】代碼分享│生物資訊分析之SCI熱門圖表-火山圖

【15】代碼分享│生物資訊分析之SCI熱門圖表-箱型圖和小提琴圖

【16】代碼分享│深度學習-人工神經網絡(ANN)的建構

【17】代碼分享│R可視化:高分文章繪圖之基于RCircos包的多類型圈圖繪制

【18】代碼分享│R可視化:基因與功能之間的關系--GO功能富集網絡圖繪制

【19】代碼分享│生物資訊分析之SCI熱門圖表—KM曲線和tROC曲線

【20】代碼分享│R可視化:惡性良性腫瘤預後模型之Cox回歸分析後用R語言繪制森林圖

【21】代碼分享│生物資訊分析之SCI熱門圖表—相關性熱圖和散點圖

【22】代碼分享│生信分析之R語言分析相關性及可視化的N種風格

【23】代碼分享│TCGA資料擷取有困難,不會預處理,學習起來

【24】代碼分享│機器學習-支援向量機遞歸特征消除(SVM-RFE)的建構

【25】代碼分享│R可視化:對兩個矩陣進行相關性可視化分析

【26】GEO資料庫多資料集差異分析整合利器RRA,再也不用糾結去除批次效應

【27】你與生信大佬的距離,隻差2分鐘搞定預後模型建構和性能評估

【28】9+SCI純生信,模型建構中的“流量明星”,你不得不知的LASSO

【29】手把手教你畫美觀大氣的lasso回歸模型圖,為你的SCI增磚添瓦

【30】R可視化:clusterProfiler包做組間比較GO富集圖

【31】代碼分享|R可視化:複雜熱圖繪制技巧之熱圖中添加柱狀圖

【32】代碼分享——基于基因突變資訊分析惡性良性腫瘤突變負荷

【33】代碼分享│富集不到想要的通路?别放棄呀,試試GSEA

【34】代碼分享│還在用PCA做降維聚類嗎?最強降維模型tSNE--你值得擁有

【35】代碼分享│GSVA:原來功能通路也能做差異分析!

【36】代碼分享│Slingshot:你不知道的單細胞拟時序分析還有它

【37】基于基因功能注釋資訊挖掘關鍵作用基因

【38】基于癌症分類預測的标志物特征提取的SVM-RFE分析代碼

【39】依據表型資料基于無監督聚類算法對研究群體進行分層聚類分析

【40】基于穩健排序整合算法對多資料集進行整合及可視化

【41】基于基因表達譜估算樣本免疫基質評分和惡性良性腫瘤純度

【42】自動化繪制LASSO算法回歸模型圖

【43】用于臨床診斷和臨床決策影響的DCA分析

【44】基于樣本預後生存資訊和臨床因素用于評價不同模型的一緻性指數軟體

【45】用于探索、解釋和評估模型的DALEX殘差分析軟體

【46】基于細菌群落功能豐度結果進行差異功能分析及可視化

【47】基于基因差異分析結果繪制其在染色體上的分布

【48】利用逐漸回歸法篩選特征基因建構Cox風險模型分析

【49】基于Immune Subtype Classifier進行惡性良性腫瘤免疫亞型分類

【50】不同物種之間的同源基因名稱轉換分析

【51】基于逐漸多因素cox回歸篩選預後标記基因并建構風險評分模型

【52】基于表達資訊挖掘與關注基因密切相關的基因

【53】基因組學基因名稱修正分析

【54】基于Spearman算法建構關聯網絡

【55】基于線性模組化方法對代謝組和轉錄組資料整合分析

【56】基于lasso回歸模型方法篩選特征基因

【57】基于線性模組化方法對代謝組和轉錄組資料整合分析

【58】基于參數型經驗貝葉斯算法和支援向量機(SVM)篩選疾病亞型特征基因

【59】基于LDA(線性判别分析)算法的微生物biomarker的篩選

【60】基于R包xCell計算64種免疫細胞相對含量及下遊可視化

【61】基于甲基化資料評估惡性良性腫瘤純度及下遊可視化

【62】基于DiffCorr包識别不同表型下的差異共表達關系對

【63】基于逆累計分布函數識别顯著偏差通路

【64】基于差異基因對通路的影響挖掘關鍵通路

【65】基于高通量資料的樣本相似性分析

需要以上代碼私信小果哦!

“生信果”,生信入門、R語言、生信圖解讀與繪制、軟體操作、代碼複現、生信硬核知識技能、伺服器、生物資訊學的教程,以及基于R的分析和可視化等原創内容,一起見證小白和大佬的成長。