天天看點

Nat. Biotech. | AI、藥物重定位和同行評審

傳統的計算分析和機器學習是否可以彌補在資訊泛濫的情況下對藥物重定位論文進行同行評審的不足?

Nat. Biotech. | AI、藥物重定位和同行評審

COVID-19的流行改變了科學和臨床成果的分享和傳播方式。根據最近的一項分析,平均每周有367篇COVID-19論文發表,從送出到被接受的中位時間僅為6天(而非COVID-19内容則為84天)。這些前所未有的同行評審周轉時間--在某些情況下還放寬了編輯标準--在新資訊可能加快對新出現的全球醫學-社會-經濟災難的了解和解決方案的背景下是合理的,但它們也有可能釋出初步或有缺陷的出版物,這些出版物可能誤導研究和開發工作,損害臨床實踐,并誤導決策者。如何彌補大流行病背景下同行評審的不足?在此,作者提出了一個政策,即嚴格的社群和同行評審與使用人工智能相結合,以優先考慮文獻中描述的研究和治療替代方案,使社群能夠将資源集中在經過适當和徹底的臨床測試的治療上。

當論文弄錯了

1998年,Andrew Wakefield和他的同僚發表了一篇論文,将疫苗接種和自閉症聯系起來。那篇論文發表12年後--因為它暗示了免疫和自閉症之間的因果關系,這個錯誤的舉動讓全世界數十萬父母反對給孩子接種疫苗--《柳葉刀》在2010年2月宣布,Wakefield論文中的 "幾項内容""是不正确的,與之前的研究結論相反"。

Nat. Biotech. | AI、藥物重定位和同行評審

是以,廣泛傳播不夠嚴謹的臨床科學的風險并不是一個新問題;然而,COVID-19的流行加劇了這一問題,因為它促使初步研究結果的釋出,而這些研究結果随後可能會根據新的證據進行修改,或者在某些情況下被證明是完全錯誤的。最近建立的未經同行審查的預印本伺服器進一步加劇了這一問題,大大降低了發表論文的門檻,繞過了關鍵的同行審查。

鑒于缺乏有效的疫苗和經過驗證的抗SARS-CoV-2的治療選擇,生物醫學科學家正在競相發表關于可快速部署的治療方案的建議。雖然新的化學和生物實體正在被評估為SARS-CoV-2感染的潛在療法,但重新定位和藥品核準标示外使用被準許用于不相關疾病的現有藥物被廣泛倡導為對抗COVID-19的治療方法。藥品核準标示外使用允許幾個小組在臨床研究中報告一些藥物的潛在療效。Table1總結了一些正在進行臨床評估的重新定位建議,其中許多是研究者提出的。

Nat. Biotech. | AI、藥物重定位和同行評審

羟氯喹的傳奇

一個典型的例子是在COVID-19中使用羟氯喹(hydroxychloroquine, HCQ)和阿奇黴素。潛在的第一個證據來自雷米西韋和氯喹(chloroquine, CQ)的組合體外研究--一種結構上與HCQ相關的藥物--其中報道了SARS-CoV-2的生長抑制。原文于1月25日送出給《細胞研究》,1月28日僅經過三天的同行評審就被接受,并于2月4日發表。這篇論文發表後,《生物科學趨勢》的編輯也收到了一封信。

3月初,來自法國馬賽IHU-Méditerranée Infection的一個醫療小組使用HCQ來治療SARS-CoV-2感染的患者。這項開放标簽、非随機臨床試驗的結果于3月16日送出給《國際抗菌藥物雜志》,3月17日接受,3月20日發表。該報告提示,HCQ與阿奇黴素聯合使用,可成功清除SARS-CoV-2感染。然而,經過仔細研究,這篇論文報告了總共隻有26名患者中隻有14名患者(在HCQ單藥治療組)和6名患者(接受與阿奇黴素聯合治療以防止細菌超級感染)的資料。盡管作者在研究中正确地提到了樣本量小、随訪時間很短的事實,但他們還是建議這兩種藥物可以作為COVID-19的治療和預防療法。

其他幾項試驗對這份報告進行了跟進,同時在非專業媒體上發表了許多出版物。到目前為止,這些試驗的結果還沒有定論.然而,2020年3月的原始研究導緻了對HCQ的巨大活動和關注,對整個工業、醫療、政治和社會環境産生了嚴重影響。雖然缺乏植根于一個多世紀的藥物安全經驗的嚴格的循證結果,但大規模的努力已經集中在HCQ作為COVID-19療法,具有全球影響。各大跨國公司響應政府上司的要求,加緊制造CQ和HCQ。其他國家紛紛囤積産品,而監管部門在沒有有效劑量或安全方案資料的情況下,匆匆忙忙地對這些藥物進行緊急審批。相關研究均未明确提及藥物現有的形态學和藥代動力學特性(如劑量、半衰期和清除率),而這些特性對原适應症的應用指導和準許至關重要。

臨床界并沒有等到更确鑿的試驗結果。而FDA最初的認可在不到3個月的時間裡就被撤銷,但許多自我治療的患者和開HCQ的醫生卻忽視或批評了随後的研究結果。由于HCQ缺乏療效的證據不斷被公布,治療的支援者提出了更多的因素,如缺乏鋅鹽與HCQ的結合,作為負面臨床結果的解釋。

經驗教訓

導緻《國際抗菌劑雜志》論文發表的為期一天的同行評審過程非常不規範。如果有一個正常的同行評議過程,很可能會確定引發這一事件的刊物不得不參考和讨論此前3月6日發表在《浙江大學學報》上的Chen等人關于HCQ的一項失敗的臨床研究。在那項針對30名COVID-19患者的對照、開放标簽研究中,服用該藥的患者中有13人在7天後病毒檢測呈陰性,而服用安慰劑的人中有14人。服用HCQ的患者中有一人後來發展成重症,兩組患者的中位康複時間相似。這項研究盡管隻針對一小部分患者,但得出的結論是,HCQ并不比标準護理更有效。

IHU-Méditerranée感染小組發表的文章根據一小部分病人的樣本提出了互相沖突的資料。該文章根據微弱的證據提出了雄心勃勃的主張,而這些證據似乎隻經過了最低限度的同行審查,但卻發表在一份受人尊敬的同行審查期刊上。3月19日,在這篇文章送出後但在它發表之前,白宮新聞秘書宣布,HCQ對COVID-19的早期結果令人鼓舞。此後,基于Twitter和電視的資訊風暴聲稱通過HCQ、阿奇黴素和硫酸鋅的治療 "100%治愈 "COVID-19,無需住院或使用呼吸機。4月10日釋出的一項位于中國武漢的随機臨床試驗的預印本顯示,62名輕度SARS-CoV-2感染患者在服用HCQ後緩解時間和體溫恢複時間較短,而一項針對150名中國患者的同行評審研究報告稱,病毒轉化率沒有差異。

3月28日,FDA(但不是歐盟)準許了CQ和HCQ對某些住院患者COVID-19的緊急使用授權(EUA)。FDA在6月15日撤銷了EUA,此前,FDA對HCQ的副作用,特别是QTc延長導緻的緻命性心律失常的可能性,以及其他心髒事件提出了一系列附加警告。盡管在過去的幾個月裡收集了更多的證據,執行HCQ在預防場合缺乏益處,但人們仍然主張預防性自我用藥。無論是從IHU-Méditerranée感染組發表的研究,還是任何後續的研究擁抱HCQ作為COVID-19的有效治療,結果都是可重複的。然而,盡管這些藥物在科學上存在弱點,但它們卻成為政治關注的對象,造成這些藥物在全球範圍内的短缺,影響了有合法治療需求的患者接受治療自身免疫性疾病的藥物。

最初的兩份高危人群調查報告繞過了現有的科學制衡機制,突出了健全的同行審查的重要性,這在全球危機期間披露新療法時尤為重要。確定科學出版物接受嚴格的同行審查,即使在緊急情況下也是至關重要的。

如何處理錯誤資訊?

尋找這場危機的即時醫療解決方案時,必須從HCQ的經驗中學習。COVID-19大流行導緻了前所未有的其他治療建議,從同行評審和預印本出版物到部落格文章、推特、電視和其他傳播管道。無論多麼合理或健全,這麼多的建議都無法由任何一個團體、機構或監管機構進行系統的評估和優先考慮。顯然,需要了解不斷增長的資料流、資訊流和知識流,以便對其進行實時整理、處理和架構。

基于字典的文本挖掘,加上專門的人工智能(AI)或原本稱為統計模式識别的機器學習(ML),如雙向生物醫學語言表示模型BioBERT,可以幫助實作這一潛力。嚴格的、以證據為基礎的同行評審加上開放的資料和計算機輔助技術,為擺脫困境提供了一條出路,并為在危機中取得合理的科學突破提供了機會(Box1)。雖然預印本服務可以迅速傳播新的研究成果,但它們沒有經過同行審查,很容易誤導非專家,鼓勵公衆進行聳人聽聞的錯誤報道。目前,在前瞻性驗證研究中,有一些可解釋的AI/ML系統,旨在根據多組學資料、化學和文本資訊預測臨床試驗的結果。在預測結果與公布結果不一緻的情況下,這些系統可以用來告誡監管者,鼓勵他們進行更仔細的審查。全面的端到端人工智能驅動的藥物發現系統,可用于臨床試驗結果的再利用和預測。

臨床藥物開發需要不同領域的專門知識。實時編纂的無偏見的臨床資料應該不受限制地提供,而且應該為這次和今後的大流行病放棄知識産權。雖然目前正在進行協調努力,但這一流行病提供了一個獨特的機會,可以為全球同步工作流程奠定基礎,確定資料的真實性,對治療方案進行公正和多角度的評估,并有效配置設定計算、人力和實驗資源。這必須在允許同行審查、事實核查和納入相關領域專門知識的情況下進行。

Nat. Biotech. | AI、藥物重定位和同行評審

傳統上,這些活動都是在實驗室進行,然後進行人體臨床試驗。鑒于動物研究設施幾乎完全關閉,需要進行重點合理的臨床試驗,值得探讨的是,這些活動中的許多活動如何能夠被現在通過計算技術(如ML、系統生物學和計算機輔助藥物再利用)獲得的能力所補充甚至取代。這些技術近年來已經成熟,并已準備好成為全球工作流程的一個組成部分,以确定新的藥物靶點和新的化學實體的優先次序,以及評估标簽外或藥物重新定位的建議。通過整合多層資料、資訊和知識,并處理大量的重新定位建議,經過驗證的基于機器智能的方法可以在不久的将來成為決策者、醫療服務提供者和整個社會的決策支援系統。如果有适當的資源和實施,這樣一個同步的工作流程可以幫助将不同的證據和假設彙內建可操作的醫療解決方案,以應對目前和未來不可避免的流行病。

實踐中,部署AI/ML方法需要全面了解其優勢和弱點。AI/ML對于在大量非線性資料集中識别相關模式是非常強大的,而不需要進行人工特征工程,因為系統可以從提供的資料中學習隐含規則。雖然訓練這種算法所需的資料量可能是一個問題,但AI/ML對大量資料的了解能力在許多情況下是一個優勢。AI/ML提供了解決這兩個問題的替代方法。

ML已經開始用于識别異質性疾病的治療幹預的生物靶點,并找到與這些靶點結合的合适候選藥物。同樣,如果在一篇論文中的經驗性臨床觀察被用來提出一種藥物作為潛在的治療方法,ML可以而且應該被用來快速模拟人群的療效和副作用。使用ML方法的同步工作流程可以基于現有的資源來分析靶點、藥物和相關的潛在副作用,它結合了臨床試驗過程中記錄的藥物、靶點和副作用的資料,以及FDA不良事件報告系統,它可以獲得以前送出給FDA的不良事件報告和藥物錯誤報告。

Nat. Biotech. | AI、藥物重定位和同行評審

關于SARS-CoV-2的生物學和作用方式仍有一些未知數。然而,關于病毒基因組序列的資訊、發現病毒用于感染細胞的受體以及對病毒結構的了解,使人們能夠确定直接作用的抗病毒藥物的潛在靶标。随着群體尺度病理資料的出現,人們已經清楚地認識到,宿主免疫反應過度活躍是導緻更嚴重疾病的明顯驅動力。自然而然,資料收集、分析政策和治療發現的重點都是針對這些資料的。

ML算法還可以通過自動識别合适的受試者,確定正确地配置設定到各組研究參與者,并為沒有産生有意義結果的臨床試驗提供預警系統,進而加速臨床試驗的設計。計算藥物再利用可以加速藥物開發過程,降低相關成本。為了确定正确的重用候選藥物,重要的是确定已知的分子靶點,預測已知藥物的新分子靶點,并考慮劑量、藥代動力學和安全性相關參數。ML能夠分析數以百萬計的藥物和患者資料執行個體以産生假設,然後提供支援或挑戰這些假設的證據,是以,ML可用于确定已知藥物的新适應症,并以各種方式組合現有藥物,使其具有各自單獨缺乏的治療能力。

醫療保健和藥物發現中,AI/ML應作為人類工作流程的輔助手段而不是替代手段來實施。AI/ML的整合提供了強大的選擇,但隻有在多學科團隊内才能取得成功,這些團隊可以確定AI/ML解決方案适應每個特定情況。從這個角度來看,在藥物發現和開發以及臨床實踐中,人類的專業知識和最終決策仍将至關重要。目前,在藥物發現或臨床實踐中大規模整合AI/ML技術的例子很少。藥物發現中,一個藥物進行臨床前測試和臨床試驗的時間架構特别長,需要更多的時間來評估其真正的影響。

結論

COVID-19大流行病突出表明,需要有新的工具來補充現有的同行審查機制,以確定所發表的生物醫學資訊的真實性和可靠性,進而指導臨床實踐和制定公共衛生政策。它還表明,研究界有能力在短時間内産生大量的異質資料--這些資訊的規模和速度可能會混淆人類的解釋。這種情況下,研究者認為AI/ML在支援資料以補充同行評審論文方面具有關鍵作用。呼籲快速開發和前瞻性驗證全面的、可解釋的AI/ML系統,這些系統使用臨床前和臨床資料,不僅能夠快速預測臨床試驗結果,還能突出已發表工作中可能存在的缺陷以及導緻失敗機率增加的特征。

繼續閱讀