天天看點

觀察|當質譜技術結合人體代謝物,泛癌篩查還有哪些挑戰?

癌症正在成為全世界主要的死亡原因和公共衛生的主要關切目标,約占死亡率的15%。世界衛生組織相關資料顯示,全球每年的癌症負擔預計将不斷增加,僅2020年就有1900多萬新病例和1000萬死亡病例。

在和癌症鬥争的漫長程序中,除了免疫治療等方法帶來新的希望之外,将鬥争的“關口”不斷往前移,這也是科學界和醫療界的努力方向之一。由此而衍生出的一種現象是:近年來,開發早期、可靠的癌症篩查診斷技術并使其成功商業化,已成為一條熱門賽道。

日前,四川大學國家生物醫學材料工程技術研究中心、複旦大學附屬中山醫院、武漢大學、安徽醫科大學第一附屬醫院、清華大學藥學院等團隊的研究人員在國際學術期刊《自然-通訊》(Nature Communication)上發表了一項研究。他們開發了一種用于泛癌症診斷的多重納米材料輔助的雷射解吸/電離(LDI)質譜方法(簡稱為“MNALCI”)。在進一步結合機器學習進行高處理能力的分析後,MNALCI可以高度靈敏地捕獲和分析1000道爾頓(Da)以下的小分子代謝物信号。

來自上海複旦大學附屬中山醫院的患者和健康對照組作為内部驗證隊列,該隊列顯示,MNALCI表現出了93%的靈敏度和91%的特異性;來自合肥的安徽醫科大學第一附屬醫院的患者和健康對照組則作為外部驗證隊列,該隊列顯示,MNALCI表現出了84%的靈敏度和84%的特異性。

觀察|當質譜技術結合人體代謝物,泛癌篩查還有哪些挑戰?

“從臨床角度來說,惡性良性腫瘤篩查确實存在着一個非常大的需求,并且它是一個比較新興的領域,是一個藍海的市場。”該項研究的作者之一、中國科學院生物化學與分子生物學博士鐘晟在接受澎湃新聞(www.thepaper.cn)記者采訪時表示,“要作為一款面對大衆的惡性良性腫瘤篩查産品,它的一個基礎條件是靈敏度要達到80%以上、特異性要達到90%甚至95%以上的名額。”他認為,無論是從臨床角度,還是從宏觀的衛生經濟學角度考慮,達到上述這些名額才會有其意義和價值。

所謂的靈敏性(Sensitivity)是指真實陽性樣本中預測為陽性的比例,即對真正癌症群體檢測出有癌症的比例;特異性(Specificity)則是指真實陰性樣本中預測為陰性的比例,即對非患癌群體檢測出陰性的比例。

值得一提的是,鐘晟強調一點,“隻有提高了靈敏度,也就是提高了篩查的效率,才能夠去節約社會資源。而追求特異性的極限,更是我們在做惡性良性腫瘤篩查的過程中需要去提升的一個性能名額參數。”他進一步解釋道,就癌症篩查來說,沒有患病的群體基數是非常大的,“比如說有100萬人篩查,可能其中99萬人都是健康人群,如果特異性太低,哪怕差一個百分點,那麼就會多将近1萬個人被誤診為惡性良性腫瘤。”

談及這項研究的初衷,該項研究的共一作者、武漢大學鄭傑博士在接受澎湃新聞(www.thepaper.cn)記者采訪時表示,團隊想解決的一個問題是,“想看看高通量非靶向的質譜技術和機器學習技術是否能解決在多個癌症中找到生物标記物的幾率?我們經過大半年的實驗,也在不斷地去調整納米基質、質譜儀器參數和機器學習算法之間的配合,最終無論是在内部驗證還是外部驗證,表現都很不錯。”基于這些前提研究,研究團隊啟動了規模更大的進一步研究。

鄭傑同時強調一點,代謝組學是目前醫學研究的熱點之一,“而無論是質譜技術,還有影像分析技術或是基因組技術,通過不同技術的搭配,然後再結合樣本的采集處理,還有和算法互相結合,我們會有不同的方案去針對不同的場景解決癌症的這樣一個大的話題。”

觀察|當質譜技術結合人體代謝物,泛癌篩查還有哪些挑戰?

利用MNALCI檢測和分類癌症。

基于代謝組學的泛癌症篩查技術

論文指出,迄今為止,像甲胎蛋白(AFP)、癌抗原19-9(CA19-9)和癌胚抗原(CEA)這些相對有效的血液惡性良性腫瘤生物标志物非常有限,但其敏感性仍然遠不能令人滿意,而非侵入性的無創早期診斷篩查方案又必不可少。

近年來,利用血液的液體活檢作為一種非侵入性和高敏感度的技術手段,在相對早期的階段檢測和定位癌症領域顯示出了巨大的潛力。相比适用于特定人群或高危人群的單癌種篩查,面向“健康人群”的泛癌種篩查也越來越受關注。

實際上,在泛癌種篩查領域中,全球多個實驗室也已開發了許多新的技術方案。2015年,阿姆斯特丹自由大學的Myron G Best等人在《Cancer Cell》上發表了一項研究,他們基于惡性良性腫瘤血小闆(TEPs)的RNA測序可用于泛癌症分析、癌症類型的區分和惡性良性腫瘤基因突變診斷。結果表明,血小闆的RNA測序可以區分癌症患者與健康人,其準确率達到96%,也能區分6種常見的原發惡性良性腫瘤類型,其準确度達到71%,并能識别幾種惡性良性腫瘤中發現的基因改變。

論文中也舉例提到,通過對從全血中分離的TEPs進行RNA-seq檢測,一種名為CancerSEEK的複合式分析血清檢測可依靠無細胞DNA和循環蛋白來檢測8種常見癌症;血清細胞外小泡的表面蛋白可被用來對6種不同癌症進行分類;最近,一種通過檢測無細胞DNA的異常片段的方法(DELFI)也被應用于針對多達7種不同癌症進行診斷和分類。

“然而,這些方法大都需要複雜的樣本制備、複雜的機器裝置以及采集大量的血樣,且準确性有待提高,限制了它們的臨床應用。”論文中如是寫道。

讓研究團隊尤其關注的一點是,癌症被認為是一種代謝紊亂性疾病,多項研究也已經證明了代謝組學在某些癌症診斷中的潛在應用。隻不過,長期以來,基于代謝組學的泛癌症篩查技術還未被開發到最優。

“代謝組學是目前醫學研究的熱點之一,我們為什麼基于代謝組學,而且還是基于高分辨率的質譜?是因為在無論是二代測序技術NGS還是傳統的液質聯用LC-MS,它們整個的實驗樣本前處理和上機的通量、效率都是很低的,無法真正滿足大規模商業化落地的需求。”鄭傑表示。

他提到,測序需要很高的成本,LC-MS的樣本處理工作則特别麻煩,“它并不是一個高通量的質譜技術,通常處理40個樣本基本就需要一天的時間。”同時,研究團隊認為,代謝組學是整個生物信号的終端産物,“我們認為代謝組學提供的資訊和表型更為接近,更适合于疾病的分型和标志物的發現。”

生物系統可以在不同層次上進行研究,從DNA到維持生命的反應。代謝組學即是系統生物學的重要組成部分,繼基因組學和蛋白質組學之後新近發展起來。其研究對象大都是相對分子品質1000Da以内的小分子物質。代謝組學随後得到迅速發展,并滲透到疾病診斷、醫藥研制開發、營養食品科學、毒理學等多領域。

鐘晟提及,随着人類基因組計劃的推進,差不多在2000年前後,基因組學就慢慢地應用到到了科研領域,甚至是臨床領域。“代謝組學大概落後基因組學10年左右,基本上是從2010年開始,逐漸地在科研、臨床診斷,包括跟消費者檢測這一塊發揮作用。”

他認為,代謝組學和基因組學“是一個平行的次元”,“市面上有很多基于DNA的技術,它可能是一個預測級别的産品,比方說預測一個人他們家族的一個基因的遺傳,或者能夠提早3年或者5年發現癌症的蹤迹,但是我們的代謝組學檢測更多地反映個體當下的表型情況,是以是一個惡性良性腫瘤普篩的技術平台。”

值得關注的是,目前國内已有多家初創公司在布局基于代謝組學的癌症早篩技術。其中,鐘晟等人于2018年創立的深圳泰萊生物科技有限公司即在其列。

更适合檢測生化小分子的質譜儀

除了代謝組學應用得日益廣泛之外,另外值得注意的是,在過去的20年裡,基于質譜技術的檢測方法也正發揮着越來越大的作用。

鐘晟談到,在這項研究中,他們面臨的挑戰即是,“質譜檢測技術目前确實沒有像NGS這麼成熟,是以面對質譜儀的研發,我們需要去解決很多的問題。”

首先是代謝物資料庫,“它不像基因這麼豐富,因為代謝組學相對基因組學的發展要滞後一些。在這樣的背景下,目前國際的權威資料庫中,代謝物的資料庫相對來講是偏少的。”研究團隊需要先行完成的是,建立一套适合中國惡性良性腫瘤患者的惡性良性腫瘤相關代謝物資料庫。

而建資料庫,則需要投入巨大的資源,包括大規模樣本的反複檢測,乃至資料和算法的不斷打磨。

據介紹,該研究項目啟動于2017年,團隊在近3年的時間裡,從複旦大學附屬中山醫院、四川大學華西醫院、中國醫學科學院惡性良性腫瘤醫院等數十家三甲醫院及國家級科研機構合作完成了超2萬例的臨床樣本采集和研究。“這是一個回顧性的臨床隊列,并且所有的惡性良性腫瘤患者都是有臨床病理金标準确診的惡性良性腫瘤患者。”

鐘晟還提及,随着該項技術的進一步商業化推廣,這一代謝組學資料庫也在不斷更新。截至目前樣本量已達到近10萬例,其中3萬多例為科研樣本,6萬多例是真實的商業檢測樣本。“基于這些資料及生信團隊的進一步挖掘,最終建立了一個中國人群的惡性良性腫瘤代謝物的資料庫。”

接下來的挑戰則是需要一台“重器”出場。“如果要更好地解決檢測的問題,那麼我們還要從相對來講比較底層的質譜的原理和質譜儀器這一塊去入手。”

1898年,在研究電離氣體流時,出生于東普魯士的德國實體學家Wilhelm Wien(1911年獲諾貝爾實體學獎)發現了一種與氫原子品質相等的正粒子。他發明了第一台質譜儀,并以此奠定了質譜學的基礎。随後的20世紀裡,JJThomson和Francis Aston等人的開創性工作使得這項技術有了質的飛躍。

所謂的質譜(MS),就是一種化學分析形式,用于測量樣品中原子或分子的質荷比(m/z)。“它能檢測的東西非常多,包括小分子領域,比如說50-1000Da分子量的物質,這些物質可能是代謝物;1000-5000Da分子量的區間裡,可能是一些多肽;5000Da以上分子量的可能是一些蛋白質,甚至是一些DNA的片段。”鐘晟提到一點,“那麼我們要解決一個問題,怎麼樣設計一台能夠更适合于做生化小分子的質譜儀,這其實也是我們在做惡性良性腫瘤篩查中需要解決的儀器的更新和疊代問題。”

第三個挑戰則是來自樣本的處理。盡管質譜儀有許多不同的類型,但總體而言均有三大環節,第一就是可以使樣品中的原子或分子離子化的方法這,統稱為離子源;第二是品質分析儀;第三則是檢測或計數m/z值離子數的方法,也被稱為檢測器。

在這項最新的研究中,研究團隊使用的技術為MALDI-TOF。MALDI即基質輔助雷射解吸電離(Matrix-assisted laser desorption/ionization),為一種離子源;TOF是品質分析儀,離子根據其m/z比率進行分離,而該比率則基于它們穿過已知長度的飛行管到達檢測器所花費的時間長度。

“MALDI-TOF跟傳統的串聯質譜或液相質譜來比較有一個很大的不同,它沒有非常複雜的液相的樣本分離的流程,如果有這樣一個樣本分離的流程,處理的周期就會非常長,導緻了這個技術可能很難大面積地普适性地去推廣。”鐘晟談到,其團隊技術在非常巧妙的樣本前處理的基礎上,能夠非常高效地分離和富集需要檢測的代謝小分子,“是以在樣本前處理的環節上面也進行了大量的研發嘗試。”

最後一個挑戰則是來自質譜儀的基質材料。論文中也指出,雷射解吸/電離(LDI)通常需要一個輔助的有機基質将能量傳遞給分析物,由于基質的本底離子,小分子代謝物檢測的準确性受到影響。而納米材料輔助的方法可以很好地适用于LDI研究低品質範圍的代謝組學,這些納米材料在吸收雷射能量的同時,不會産生令檢測信号複雜化的團簇離子。

觀察|當質譜技術結合人體代謝物,泛癌篩查還有哪些挑戰?

兩種納米材料的制備。

鐘晟也進一步解釋道,從傳統的MALDI-TOF質譜來講,用的最多的基質是有機小分子基質,比如說 CHCA(a-氰基-4-羟基肉桂酸),或者是DHB(2,5-二羟基苯甲酸)等。“小分子基質在做代謝物檢測的時候會存在一個問題,因為它本身的分子量就是跟檢測的這些代謝物的分子量是相似的,是以如果用這種有機小分子基質來做檢測的話,它會存在一個很大的信号幹擾。”正因如此,傳統的MALDI-TOF檢測的往往是大分子,例如微生物的膜蛋白檢測,或者是用于單核苷酸多态性(SNPs)分型等。

論文中同時指出一點,此前的研究一般都依靠單一的納米材料基質進行LDI分析,指紋分析資訊有限,容易出現誤報。

在這項研究中,研究團隊在經過大量的篩選後,“最終确定了兩大類可行的納米材料,能夠對我們檢測的質譜檢測的信号進行很好的富集和放大,最終得到高品質的資料結果。”鐘晟表示。第一種類型的納米材料是第一種納米材料是Au/SiO2核/殼納米粒子,第二種類型的納米材料則是利用Agassisted化學蝕刻技從n型矽片上獲得的高多孔性矽納米線。

“納米材料在這項研究中最核心的作用就是去放大雷射能量,并且由于納米材料具有實體化學的穩定性,它比較難産生小分子區間的幹擾,是以相比傳統的基質材料,在做代謝物或者小分子物質檢測上面,它有較強的獨特優勢。”

值得一提的是,目前國内使用的質譜儀系統多數由德國布魯克、美國SCIEX、日本島津等進口廠商主導,而鐘晟等人建立的泰萊生物的團隊還在進行質譜儀的國産化。“我們轉向儀器自研國産化是基于實際科研需求,也符合宏觀政策的方向。從整個産業的角度來看,我們認為上遊儀器‘卡脖子’的問題也必須解決。”鄭傑表示。

鐘晟則談及,如果類比稱手機或者電腦,質譜儀也會涉及很多零部件的采購,“雷射器、探測器、采集卡,包括無數的電源、開關、晶片,包括印制線路闆 PCB等,裡面的各個零部件難免涉及到跨國采購。但是這不僅僅隻是個單純組裝的過程,需要對各個零部件有深刻的了解和對真實業務場景需求的了解,通過不斷的調試和測試資料的回報,才能做出一台真正适合自己的質譜儀。”他同時提到,MALDI-TOF也是目前各類型質譜儀中國産化進度最快的一個平台,“目前我們的國産化率基本上可以實作85%以上。”

鄭傑同時強調一點,無論是納米基質材料的篩選,還是質譜儀的國産化,這些研究并不僅僅是一項科學實驗,“它最終還是反映到資料上,讓檢測結果真正可實作基層應用。”

多種液體活檢政策的結合可進一步提高準确性

在這項研究中,研究團隊從中國兩個醫院選取的隊列進行了MNALCI泛癌篩查測試。

上海隊列由1008人組成,包括203名健康對照組和805名被美國癌症聯合委員會(AJCC)診斷為I-IV期癌症的患者:其中肝癌(n = 139)、肺癌(n = 76)、胰腺癌(n = 97)、結直腸癌(n = 238)、胃癌(n = 119)和甲狀腺癌(n = 136),來自中國上海複旦大學附屬中山醫院。

合肥隊列包括175人,其中包括30名健康對照組和145名I-IV期癌症患者:肝癌(n = 29)、肺癌(n = 28)、結直腸癌(n = 30)、胃癌(n = 30)、甲狀腺癌(n = 28),作為該研究的外部驗證隊列進行進一步調查。遺憾的是,在合肥隊列中缺乏胰腺癌的病例。

結果顯示,在内部驗證隊列中,MNALCI表現出了93%的靈敏度和91%的特異性;在外部驗證隊列中表現出了84%的靈敏度和84%的特異性。此外,在上述6種癌症中,識别惡性良性腫瘤組織的總體準确性在内部驗證隊列中為92%,在外部驗證中為85%。

研究團隊發現了多達8個代謝物生物标志物。即2-氧代戊酸、組胺、葡萄糖、5-羟甲基尿嘧啶、2-糠酸、甲基丙二酸、4-甲基兒茶酚和L-肉堿,這些代謝物中,有大部分在其他地方被報道過與癌症有關系。

研究團隊在論文中強調,需要注意的是,MNALCI方法并非要取代其它液體活檢方法。相反,這種方法可與如mRNA、miRNA、突變的或5-羟甲基化的cfDNA、循環蛋白等其它生物标志物篩選政策相結合。他們還指出,MNALCI方法并不能區分NSCLC、CRC和PTC中常見的緻病性突變。然而,基于cfDNA突變的液體活檢在很大程度上依賴于驅動基因的突變,對于具有陰性驅動基因突變的癌症(占癌症中的很大一部分)來說,其靈敏度可能會受影響。

觀察|當質譜技術結合人體代謝物,泛癌篩查還有哪些挑戰?

MNALCI與血清惡性良性腫瘤抗原診斷特異性惡性良性腫瘤的比較。

研究團隊認為,多種液體活檢政策的結合可以提供額外的資訊,進一步提高癌症診斷和識别惡性良性腫瘤組織來源的準确性。

鄭傑也對澎湃新聞記者表示,多組學是未來的一個大趨勢。“代謝物是信号通路的終端産物,代謝物的資訊和最終的表型更為接近,更利于癌症的分型和标志物的發現,但我們也認為臨床患者的真實情況應該是從生命多個次元去反映的,是以我們也正在去從多組學這個方向去探索一些癌症的研究,會結合基因組、代謝組、影像組等,融合。”

鐘晟則強調一點,惡性良性腫瘤檢測其實有非常細分的場景:“惡性良性腫瘤的普篩(或叫惡性良性腫瘤初篩),到高危人群的精篩,再到疑似惡性良性腫瘤患者的早期診斷,再到臨床金标準診斷,至少可以分為4個階段或4個場景去做産品的設計和疊代。”

而他認為,從目前的技術來看,“這十幾年裡很難做到一種技術能夠同時解決篩查和診斷的問題。”

“我們的真實的感受是,針對不同場景,我們從樣本的采集、樣本的處理到建庫,再到算法,直至最後模型,這些都是不一樣的。”鄭傑也類似提及,“而無論是質譜技術,還有影像分析技術或是基因組技術,通過不同技術的搭配,然後再結合樣本的采集處理,還有和算法互相結合,我們會有不同的方案去針對不同的場景解決癌症的這樣一個大的話題。”

研究團隊在論文中還總結提到,這行研究為實作高成本效益和高通量的多癌種篩查技術奠定了概念和實踐基礎。“在不遠的未來,該方法的檢測成本預估可低于100美元,一個裝置齊全的實驗室每天可分析超過3000個樣本。”

論文連結:https://www.nature.com/articles/s41467-021-26642-9

繼續閱讀