天天看點

Nature Methods | TooManyCells:單細胞聚類和可視化方法

2020年3月2日賓夕法尼亞大學的Gregory W. Schwartz等研究人員在nature methods上發表了題為TooManyCells identifies and visualizes relationships of single-cell clades的文章,該工作提出了TooManyCells方法,用于有效和無偏地識别和可視化單細胞,為細胞狀态分層、探索和檢測稀有叢集提供靈活的平台。

Nature Methods | TooManyCells:單細胞聚類和可視化方法

1.研究背景

識别和可視化轉錄相似的細胞有助于準确探索單細胞轉錄組學揭示的細胞多樣性,然而常見的聚類和可視化算法需事先設定細胞簇數,固定的簇數往往阻礙了我們識别和可視化細胞狀态的能力。為解決這些問題,賓夕法尼亞大學的Gregory W. Schwartz等研究人員開發了一套基于圖的單細胞聚類和可視化算法TooManyCells,用于有效和無偏地識别和可視化細胞類群。相比于現有流行的聚類和可視化算法,TooManyCells可以同時分層稀有和常見的細胞群體并探索它們之間的關系。

2.TooManyCells

TooManyCells實作了一套基于圖形的算法和工具,可以高效、全局且無偏地識别和可視化細胞進化枝。TooManyCells可以在不同的聚類解析度下維持并呈現聚類關系,能夠準确地識别并清晰顯示稀有亞群和豐富亞群。在多個資料集上的實驗結果顯示:在檢測和可視化稀有種群方面,TooManyCells的性能優于其他流行方法。

TooManyCells的功能可以總結為以下三點:

聚類:TooManyCells實作了最初用于文本挖掘的無矩陣分層譜聚類,使用該聚類方法的最終結果是一種樹狀結構,其中每個内部節點是一個粗略的簇,每個葉子是每個子產品化度量中最精細的簇。

可視化:TooManyCells算法使用BirchBeer渲染方法顯示單細胞群集層次結構。

差異表達:給定多個群集辨別号,TooManyCells可以執行差異表達分析以識别這些群集中細胞的基因表達之間的差異。

3.方法

3.1 聚類

TooManyCells實作了無矩陣分層譜聚類。

Nature Methods | TooManyCells:單細胞聚類和可視化方法

這種方法可以遞歸地應用于每個劃定的群集,直到達到停止标準,最終得到分裂的層次群集結構。

3.2停止标準

TooManyCells使用Newman-Girvan子產品化Q作為停止标準,使用Q度量節點劃分的強度,Q測量簇内邊緣到其它簇的随機分布的距離,Q>0表示非随機群落,Q≤0顯示存在随機發現的群落。TooManyCells使用Q來評估一個候選的細胞劃分,确定該是繼續遞歸還是将該劃分結果作為層次聚類中的一片葉子。

3.3可視化

TooManyCells的聚類算法最終最終産生一種樹狀結構,其中每個内部節點是一個粗略的簇,每個葉子是每個子產品化度量中最精細的簇。TooManyCells使用BirchBeer方法展示單細胞群集層次結構。BirchBeer提供了多種圖形功能,可幫助檢測和解釋細胞簇。在樹的葉子上繪制用顔色編碼的單細胞,可促進對單細胞解析度的探索。

4.實驗

4.1 細胞-分化枝關系的可視化

清晰的可視化對于scRNA-seq資料探索至關重要,對于複雜的細胞混合物,基于投影的算法會呈現許多重疊的細胞,這會降低單細胞的可視化效果。更重要的是,這些算法通常不會報告叢集間的定量關系,并且在整個聚類解析度中缺乏可解釋的可視化效果。TooManyCells可以解決這些限制,在樹資料抽象中對叢集間關系進行完全可定制的可視化,TooManyCells可視化和聚類算法如圖1。

Nature Methods | TooManyCells:單細胞聚類和可視化方法

圖1 TooManyCells可視化和聚類算法

4.2 準确地描述稀有亞群和豐富亞群

TooManyCells聚類不僅可以從常見群體中檢測到稀有群集,而且可以區分各個稀有群集。t-SNE投影的可視化結果顯示實際細胞類型與其聚類标簽之間存在差異, 難以區分混合物中的兩個稀有群集,相比之下,TooManyCells能夠分離稀有和豐富群集,并且能分離兩個稀有群體。TooManyCells通過子產品化值指出稀有群集,稀有種群即使在沒有細胞類型标簽的情況下也很容易被識别。使用常用的聚類方法對兩個稀有群集和豐富群集混合物的細胞進行檢測的實驗結果如圖2。

Nature Methods | TooManyCells:單細胞聚類和可視化方法

圖2 聚類算法對兩個稀有群集和豐富細胞群集混合物的細胞進行檢測

5.總結

TooManyCells通過遞歸技術反複識别在樹結構中亞群,其可視化模型結合一系列可視化特性為細胞狀态提供一個靈活的平台,跟蹤、探索和檢測稀有種群。除了聚類和可視化之外,TooManyCells還提供其他功能,包括但不限于異質性評估、聚類測量、多樣性和稀有性統計。TooManyCells同時識别稀有和豐富細胞群體的優越性可在三個獨立的環境中得到證明,在控制環境中,該方法不僅将兩個稀有細胞群體從普通細胞群體中分離出來,而且成功地将兩個稀有細胞群體分離。

研究者在設計該方法時還考慮了其靈活性和通用性。TooManyCells是由多種算法組成的通用架構,這些算法可與其他現有算法互換,TooManyCells的聚類和可視化子產品也可以分别用于分析其他單細胞基因組或觀察特征資料。

繼續閱讀