天天看點

利用人工智能衆包資料,加速藥物發現

新的加密系統可以讓制藥公司和學術實驗室共同合作,更快地開發新的藥物,而不會向競争對手透露任何機密資料。

該計算系統的核心是一種稱為神經網絡的人工智能程式。AI研究哪些藥物與人體内的各種蛋白質互相作用以預測新的藥物蛋白質互相作用的資訊。

更多的教育訓練資料産生了更聰明的人工智能,這在過去是一個挑戰,因為藥物開發人員通常不會因知識産權問題而共享資料。研究人員在10月19日的“ 科學”雜志上報告說,新系統允許人工智能将資料衆包,同時保持資訊的私密性,進而鼓勵合作夥伴加快藥物開發。

确定新的藥物蛋白質互相作用可以揭示各種疾病的潛在新療法。或者它可以揭示藥物是否與非預期的蛋白質靶标互相作用,這可能表明藥物是否可能引起特殊的副作用,匹茲堡大學的計算生物學家Ivet Bahar說,他沒有參與這項工作。

在新的AI教育訓練系統中,從研究組彙集的資料在多個伺服器之間進行配置設定,每個伺服器的所有者看到的似乎隻是随機數。“這就是加密魔法發生的地方,”位于夏洛茨維爾的弗吉尼亞大學的計算機科學家大衛吳說,他沒有參與這項工作。雖然沒有個體參與者能夠看到組成訓練集的數百萬種藥物蛋白質互相作用,但是伺服器可以共同使用該資訊來教導神經網絡來預測先前看不見的藥物蛋白質組合的互相作用。

“這項工作具有遠見卓識,”伊利諾伊大學厄巴納香槟分校的計算機科學家簡鵬說。“我認為它将為生物醫學合作的未來奠定基礎。”

麻省理工學院計算生物學家Bonnie Berger及其同僚Brian Hie和Hyunghoon Cho通過在大約140萬個藥物蛋白質對上訓練神經網絡來評估他們系統的準确性。這些對中的一半來自已知藥物蛋白質互相作用的STITCH資料庫; 另一半包含不互相作用的藥物蛋白質對。當顯示已知互相作用或不互相作用的新藥物蛋白質對時,AI選擇哪些組以95%的準确度互相作用。

為了測試該系統是否能夠識别迄今未知的藥物蛋白質互相作用,Berger團隊随後在近200萬個藥物蛋白質對上訓練神經網絡:已知互相作用的整個STITCH資料集,以及相同數量的非互相作用對。經過充分教育訓練的人工智能建議進行了幾次以前從未報告或已報告但未在STITCH資料庫中進行的互動。

例如,AI鑒定了雌激素受體蛋白與開發用于治療乳腺癌的藥物(稱為屈洛昔芬)之間的互相作用。神經網絡還發現了白血病藥物伊馬替尼與蛋白質ErbB4之間從未見過的互相作用,該蛋白質被認為與不同類型的癌症有關。研究人員證明這與實驗室實驗互相作用。

該安全計算網絡還可以鼓勵在藥物開發之外的領域中的更多協作。彭說,醫院可以分享機密健康記錄,以教育訓練預測患者預後或設計治療政策的人工智能項目。

“無論什麼時候你想研究大量的人的行為,基因組學,醫療記錄,法律記錄,财務記錄,任何對隐私敏感的東西,這些技術都非常有用,”吳說。