天天看點

ChatGPT爆火,微軟谷歌紛紛跟進……這些AI在生物産業有哪些應用?

▎藥明康德内容團隊編輯

近期ChatGPT可謂火遍全網。昨日,微軟(Microsoft)公司表示,将把ChatGPT整合到搜尋引擎Bing和網絡浏覽器中,谷歌(Google)公司也在今日展示了其名為Bard的人工智能對話系統。這些系統可以根據使用者提供的複雜問題,提供全面而綜合的回答,小到制定詳細的旅行計劃,大到分析公司的營運政策。在生物醫藥領域,ChatGPT的應用前景也受到廣泛關注。今日,藥明康德内容團隊将結合公開資料,展望這一新興AI模式在生物産業中的應用。

圖檔來源:123RF

科學探索的得力助手

如今,科學研究的發展日新月異,每天有成百上千篇科學論文釋出,如何跟上科學研究的步伐是科研人員需要面對的挑戰。基于ChatGPT的人工智能系統,微軟公司已經開發了一款稱為BioGPT的人工智能系統,它接受過科學文獻網站PubMed上超過1500萬篇摘要的訓練,可以根據使用者的提問迅速提供相關的答案。在PubMedQA檢測中,這款人工智能模型達到81.0%的準确性。

ChatGPT爆火,微軟谷歌紛紛跟進……這些AI在生物産業有哪些應用?

圖檔來源:參考資料[8]

微軟公司在介紹整合ChatGPT的浏覽器時表示,這一系統能夠在閱讀冗長财報時,打開一個新視窗,讓使用者通過提問,提煉文章的要點,并且與其它财報進行比較。應用在科學文獻整理上,這一系統有望改變我們未來查詢和閱讀論文的模式。人工智能系統不但能夠幫我們找到文獻,還能“一鍵劃重點”,并且與其它文獻進行比較,大幅度提高從科學文獻中獲得資訊的速度。

發掘科學洞見

ChatGPT背後的大型語言模型利用對海量人類語言資料的分析,學習人類語言的文法和其它特征。這一學習方式也可以用于解讀基因組DNA序列。科技公司Nvidia在今年的JP摩根醫療健康大會上指出,随着新一代基因組測序速度的不斷加快和成本的不斷降低,目前我們測序基因組DNA的能力已經超越了分析DNA序列并從中擷取洞見的能力。而更快速有效地處理海量的基因組序列資訊離不開人工智能。大型語言模型通過像分析人類語言一樣分析DNA序列,可以加快基因組的拼接、基因突變的發現,并且用人類對話的方式将發現表述給研究人員。

比如,整合ChatGPT的基因測序分析系統可能在處理患者的基因組測序資料後給出“這名患者的X基因上的突變可能導緻罕見遺傳病Y”的總結,支援臨床醫生做出更快決策。

ChatGPT爆火,微軟谷歌紛紛跟進……這些AI在生物産業有哪些應用?

▲大型語言模型和生成式人工智能對基因組學至關重要(圖檔來源:Nvidia官網)

助力科學突破

基于大型語言模型的人工智能系統已經被用于學習蛋白質中氨基酸順序與蛋白結構和功能之間的關系,助力人工設計全新的蛋白質。日前在Nature Biotechnology上發表的一篇

論文

中,研究人員使用基于大型語言模型設計的ProGen系統,設計出具有和自然溶菌酶活力相似的全新溶菌酶。他們表示,這一新技術可能比獲得諾貝爾獎的定向進化(directed evolution)蛋白設計技術更有威力,給蛋白工程學領域注入新的活力。

ChatGPT爆火,微軟谷歌紛紛跟進……這些AI在生物産業有哪些應用?

▲ProGen等AI系統能夠從頭設計具有特定功能的全新蛋白(圖檔來源:參考資料[13])

提高科學論文和醫學報告寫作效率

近日在Nature和The Lancet Digital Health上發表的文章指出,ChatGPT未來的一項重要應用,是将科學家和醫生從一些重複性勞動中解脫出來,更好地聚焦于科學研究和治療患者。比如,很多研究人員已經在使用ChatGPT來幫助寫作科學論文的背景材料部分,或者用它來輔助對論文的編輯。在醫院的環境裡,ChatGPT有可能替代醫生撰寫出院總結等具有标準格式的報告。

哪些挑戰需要克服?

雖然ChatGPT在生物醫藥領域具有廣闊的應用前景,但是業界人士也指出這一系統目前存在的一些隐患。比如,目前大型語言系統的一個缺陷在于提供資訊的真實度有待提高。由于ChatGPT基于對已有語言資料的學習提供回答,它的回答也受到資料庫中不真實、有偏見、或者過時知識的影響。這意味着對于專業性強的話題,如果大型語言系統沒有經過足夠專業資料的訓練,很可能提供錯誤的回答。具有足夠專業知識的研究人員仍然能發現并且糾正這些問題,但是沒有專業知識的使用者就很容易被誤導。

此外,訓練ChatGPT的語言資料中也包含了人類的曆史偏見,包括種族、性别、文化、年齡歧視等不良因素。由于這些曆史偏見廣泛存在于語言資料庫中,很難人工剔除,如何防止ChatGPT根據這些資料輸出有害言論是需要解決的另一個挑戰。

有些研究人員指出,建立使用ChatGPT的規範和法規至關重要,以確定這一技術被正當、透明和公平的使用。比如,Nature等多家學術雜志已經發表聲明,指出遞交待發表的學術論文時,需要明确指出ChatGPT等大型語言模型的使用。

日前,斯克裡普斯研究所的著名學者Eric Topol博士在展望人工智能應用的未來時表示,包括大型語言模型在内的AI系統未來不但有望幫助診斷癌症,而且通過将人體掃描圖像中的特征與學術文獻中的文字聯系起來,可以增強對疾病的了解。他同時強調這些努力應該在專家的監督下進行。

ChatGPT等生成式AI的進展日新月異,研究人員選擇如何使用它們将決定我們的未來。“2023年隻是開始!”Topol博士說。

繼續閱讀