天天看點

生信新秀 | 達普生物單細胞 RNA-seq 分析軟體——StarScope

單細胞測序在生物醫學研究領域空前火爆,重磅研究碩果頻出,而高昂的價格和複雜的實驗流程使得這項技術較難普及。

單細胞測序的流程包括樣本制備、單細胞文庫建構、文庫測序及生信分析四個部分。其中單細胞文庫建構及生信分析是單細胞測序中兩個最關鍵步驟,決定了能否獲得高品質結果以及研究人員能否從原始資料提取出正确的生物資訊。

達普生物自主開發了單細胞測序全流程解決方案 —— Galaxy 星海單細胞建庫系統、 星海單細胞 3' 轉錄組測序建庫試劑盒及 StarScope 生信分析軟體,其中 StarScope 生信軟體即是用于測序後生信分析的工具。利用 StarScope 軟體獲得的資料報告可相容用于後期個性化分析的免費開放軟體如 R 包、cellxgene 等,完整解決從細胞到生信資料報告的全流程處理!

下面就讓我們一起來了解一下達普生物自主研發的 StarScope 生信分析軟體吧!

StarScope 是達普生物自主開發的,其基于 STARsolo 和 Seurat 的 nextflow pipeline, 提供一站式的單細胞 RNA-seq 分析方案,可完成從原始的 reads 到細胞基因表達矩陣輸出,并生成一個完整的 HTML 格式資料報告,表達結果還可接入多種下遊分析。

▉ 軟體功能:

3‘-RNA-seq pipeline

• 通過 cutadapt 對原始 reads 進行過濾和質控,将低品質堿基和 N 堿基切除掉,利用 fastqc 生成包含堿基比例分布的報告,協助使用者判斷 library 是否異常。

• 利用 STARsolo 将過濾後的 reads map 回 reference genome,自動完成 barcode 和 UMI 序列的識别和糾正,并根據 mapping 結果生成 feature-barcode 矩陣。

• 根據表達矩陣,Starcope 調用 Seurat 進行初步的細胞分群聚類,并傳回每個群的 marker gene。

StarScope mkref

• 協助使用者建構定制化的 reference index。使用者的研究樣本可能并非正常的人類或者小鼠樣本,例如基因編輯後的樣本或者是非模式物種,這時可以利用 StarScope mkref 建立定制化的 reference index 再進行單細胞 RNA-seq 分析。

▉ 結果清晰:

StarScope 的報告包括多種結果參數,不僅展示細胞數量、細胞中的平均 reads 數量等關鍵結果,同時也輸出飽和度、mapping rate、barcode reads 和 cDNA reads Q30 統計等資訊,協助使用者評估 library 本身的品質。另外還可 輸出初始的細胞分群結果以及各群中的差異表達基因,并将原始的表達矩陣儲存為 HDF5 格式(h5Seurat)便于分享。

生信新秀 | 達普生物單細胞 RNA-seq 分析軟體——StarScope
生信新秀 | 達普生物單細胞 RNA-seq 分析軟體——StarScope

▉ 輸入簡單:

Starcope 的輸入格式非常簡單,使用者僅需要提供一個包含 sampleID 和 FASTQ 檔案路徑的 CSV 檔案、白名單檔案和建構好的 STAR reference index 檔案即可直接運作。

sample list 檔案示例如下(fastq_1 是 barcode read,fastq_2 是 cDNA read):

sample,fastq_1,fastq_2

sampleID,read1.fq.gz,/absolute/path/to/read2.fq.gz

ThudnerBio scRNA-seq 的白名單檔案位于

starscope/whitelist/V2_barcode_seq_210407_concat.txt.gz,需要先解壓再使用。

StarScope 軟體能夠建構一個和 10x cellRanger 類似的 reference index,對于人或者小鼠樣本的分析,可以使用 starscope 中自帶的腳本 prepare_10x_compatible_reference.sh 進行建構。如果分析其他物種,僅需準備此物種的參考基因組序列檔案(FASTA)和對應的基因注釋檔案(GTF)就可以直接使用 mkref 指令生成 index。

使用 mkref 建構 Zebrafish reference index,需要先通路 Ensembl 網站的 Zebrafish 首頁下載下傳 FASTA 和 GTF 檔案:

生信新秀 | 達普生物單細胞 RNA-seq 分析軟體——StarScope

• 下載下傳基因組序列 FASTA 檔案

(http://jj6m.cn/TV3pK)

• 下載下傳基因注釋 GTF 檔案

(http://sj0b.cn/E4WAy)

• 運作 starscope 指令如下,示例中 reference檔案夾命名為 Danio_rerio.GRCz11.107_STAR。

生信新秀 | 達普生物單細胞 RNA-seq 分析軟體——StarScope

▉ 高重複性:

StarScope 支援 conda 和 docker 運作環境,保證了資料分析的高重複性,達普生物提供已配置完備的 docker image 供使用者使用,無需使用者額外配置,也無需擔心軟體版本相容性問題。

▉ 高拓展性:

StarScope 基于 nextflow,支援多種運作環境,并可直接接入 HPC 的作業排程系統。使用者可以直接使用 —— executor slurm 參數将任務送出給系統的 slurm 作業排程系統,同時也相容 sge、pbs 等。支援完全容器化運作,并可輕松部署到雲端 kubernetes。

生信新秀 | 達普生物單細胞 RNA-seq 分析軟體——StarScope

全程自主研發,讓生信分析更簡單,軟體具有諸多優秀性能:

易使用:Linux 系統下安裝後即可使用。

多功能:質控報告、Mapping 結果、表達矩陣分析報告。

高相容性:輸出的矩陣檔案,運用各種 R 包、cellxgene 等免費軟體進行資料挖掘。

生信新秀 | 達普生物單細胞 RNA-seq 分析軟體——StarScope

基于專利編碼微球及微流控油包水單細胞包裹技術:

性能優:可一次性完成數百至數萬個細胞的分離,基因檢測靈敏度高。

上樣活:1-4 通道,可靈活選擇樣本數及細胞數量,友善快捷。

相容好:文庫相容目前不同的主流測序平台。分析全:自主開發的 StarScope 生信分析軟體,可完整從原始資料到分析報告的生信分析。

流程活:可接駁下遊流程 ,如單液滴分選。

多應用:同時相容單細胞轉錄組,免疫組庫和表觀組試劑盒。

生信新秀 | 達普生物單細胞 RNA-seq 分析軟體——StarScope

達普生物科技有限公司孵化于香港科技大學,于 2018 年由多位海歸博士共同創立。在深圳、嘉興、香港三地設有研發中心,研發團隊近 100 人,建立了集微流控晶片、儀器及試劑生産為一體的 GMP 廠房。

公司專注于将液滴微流控技術應用于精準醫學領域,緻力于成為集微流控晶片、儀器、試劑的研發和生産于一體的完整解決方案提供商。公司自主研發、生産兩大技術平台:數字 PCR 系統和單細胞組學系統,應用于癌症研究、癌症早期篩查、靶向治療、無創産前診斷、病毒定量檢測、高通量藥物和抗體篩選等領域。

●星海單細胞建庫系統

生信新秀 | 達普生物單細胞 RNA-seq 分析軟體——StarScope

1. 采用獨家開發的水凝膠編碼微球和液滴微流控技術,性能優越;

2. 針對不同細胞數、種類及上樣量,1-4 通道,靈活調整,使用更加友善;

3. 流程靈活,可以接駁下遊流程。

●彗星高通量篩選系統

生信新秀 | 達普生物單細胞 RNA-seq 分析軟體——StarScope

1. 基于熒光标記及電介泳效應推動分選,無損傷;

2. 接駁 Galaxy 單細胞建庫系統,提高建庫品質并降低測序成本;

3. 接駁星雲數字 PCR 系統,篩選陽性液滴,富集微量靶标 ,降低測序成本;

4. 快速單克隆抗體細胞株或轉染陽性單細胞篩選。

●星雲全自動數字PCR系統

生信新秀 | 達普生物單細胞 RNA-seq 分析軟體——StarScope

1. 專利壓力不敏感液滴生成技術:液滴生成大小均一,擴增更穩定;

2. 3.5 分鐘内可同時處理 1-32 個樣本:上樣靈活,滿足高通量需求;

3. 液滴可回收,接駁單液滴分選儀,後續用于測序或目标基因檢測。

繼續閱讀