天天看點

天士力與華為釋出數智本草大模型

作者:中國經營報

本報記者 晏國文 曹學平 天津報道

(天士力醫藥集團董事長闫凱境作主題演講 主辦方/圖)

2024年,“人工智能+”首次被寫入《政府工作報告》。在席卷全球的人工智能浪潮下,傳統中藥産業将迎來怎樣的新發展機遇?

日前,在天津天士力國際交流中心舉辦的數智賦能大健康産業新質生産力暨第四屆中醫藥國際發展大會上,天士力與華為共建的數智本草大模型正式釋出。

“數智本草語言大模型擁有380億參數量,基于中醫藥海量文本資料預訓練,結合向量庫檢索強化,以及中藥研發多場景的微調,能夠更好地幫助研究者完成中醫藥理論證據的挖掘和總結。”現代中藥創制全國重點實驗室常務副主任、天士力醫藥集團董事長闫凱境介紹。

華為雲AI(人工智能)科學計算總經理、醫療首席科學家喬楠表示,人工智能是進一步解放和發展企業生産力非常重要的工具。數智本草大模型覆寫了問答、生成、智能計算等領域。天然産物分子是中醫藥最大的寶庫之一,許多知名藥物都是從天然産物中提取的。基于天然産物這個巨大寶庫更好地進行藥物發現,是實作中藥數智化的重要路徑。

進入數智時代

數智中藥由傳統中藥、現代中藥演變而來。

據《數智中藥——現代中藥的數智化發展白皮書》,數智中藥以包括人工智能在内的颠覆性科學技術為突破,創新性配置包含中醫藥海量資料的新型生産要素,結合雲計算、大模型等新型技術手段,通過中藥産品的組方配伍數智化、物質基礎數智化、量時毒效數智化、生産質控數智化、臨床應用數智化、消費認知數智化(六化),引領現代中藥達到用藥精準、生産精智、療效精确(三精)的新高度,進而打造數智中藥研發新範式。

“現代中藥在國家标準化管理委員會和國家中醫藥局的上司下,已建設了一批國家标準,在藥材種植、制劑生産、藥理藥效研究及臨床應用等方面,基本實作了跨學科、多層次的知識融合。但因中藥面臨着原料品質波動大、物質組成複雜、毒副作用認識不足、作用機制不清等問題,現代中藥産業的發展依舊存在某些瓶頸。”闫凱境表示,相對于化學藥,中藥缺乏符合中醫藥特色的臨床證據與科學驗證,一定程度上制約了臨床應用與推廣。随着大資料、雲計算等為代表的人工智能技術的飛速發展,數智化已成為推動中醫藥行業發展的新動力。

闫凱境表示,數智中藥以患者需求為導向,根據患者臨床症狀、體征和病情演變進展過程,在中醫藥理論的指導下,依托中醫藥數智大模型工具,以資料+機理(AI for Science)融合突破傳統中藥一人一方的經驗模式,實作精準獲益的數智中藥設計模式。是以,以“六化三精”為核心内涵的數智中藥,已成為天士力現代中藥走向未來的明确方向。

在數智中藥的發展過程中,逐漸形成了三條關鍵路徑:一是以多元度多模态數智中藥研發技術,深刻解析藥物與疾病特征的路徑;二是以智能制造技術,保障中藥産品品質精準控制、高效、綠色、可持續發展的路徑;三是以智慧中醫大腦,高效賦能數智中藥個體化精準服務的路徑。

闫凱境介紹,目前,天士力基于這三條關鍵路徑在中藥研發、制造等領域不斷進行創新性自我重塑和持續沉澱,全力打造了星鬥雲中醫藥特色數智平台,在中藥、疾病機制解析和指導中藥新品種開發中發揮了重要作用;建立了“以品質數字化為核心的中藥智能制造技術體系”,科技成果經鑒定達到國際領先水準,并榮獲2022年天津市科學技術進步特等獎。

助力“說理”“尋藥”

據介紹,目前數智本草大模型集守正(1000+古籍及翻譯,9萬+方劑,4萬+中成藥等)、創新(4000萬+文獻摘要,300萬+天然産物,2萬+靶基因通路資訊等)、産業化(10萬+臨床方案,16萬+中藥專利以及藥典政策指南等)三大類海量資料于一體。

“數智本草”計算大模型,基于數十億分子結構的預訓練,使用350萬特有的天然産物分子資料微調,能夠更精準地執行“表征天然産物分子、提高下遊屬性預測”等計算任務,并可結合相應算法快捷實作藥材與複方的篩選和優化。大模型深度挖掘和整合中醫經典理論和中藥藥理、中藥配伍以及臨床應用的内涵和聯系,通過“智能問答”、“互動計算”和“文檔生成”三種應用模式,實作“從病到方”和“從方到病”兩大目标。

闫凱境介紹,數智中藥研發的關鍵内容是“說理”和“尋藥”,需要融彙傳統中醫藥理論與現代醫學、系統生物學等多種學科,是一個複雜的系統工程。近年來,天士力利用AI賦能中藥“說理、尋藥”,即通過“從方到病、從病到方”兩大路徑,打造“數智中藥”研發新範式。

在“從方到病”的說理方面,天士力在多年的研發實踐中,積累了海量的中醫藥資料,自主研發建立了星鬥雲系統,可以基于已有的方劑、已上市的産品,運用知識圖譜及多項技術,針對“方”形成了“藥效組分”— “作用靶點”— “基因網絡”的中藥數字化解析方法。

在“從病到方”的尋藥方面,目前,天士力與華為共建“數智本草”大模型,這是對已有星鬥雲系統的更新疊代,助力了中藥創新研發。

“我們前期已經積累了豐富的中醫藥理論知識,将天士力積累的中醫藥研發資料、生産資料、市場資料,與華為雲大資料結合,使我們在星鬥雲的基礎上,能夠更容易實作‘六化三精’。”闫凱境說,一方面基于華為的語言大模型為解析中醫藥提供了更好的工具;另一方面基于華為的盤古分子大模型,能夠有助于将多年積累的近350萬個天然藥物分子的資料,形成專屬的天然藥物模型,并為打造複方藥物模型提供了可能。

闫凱境表示,數智本草大模型1.0版通過智能問答、文檔生成以及互動計算三種模式,推進中藥複方、藥材、成分從篩選、優化到臨床等全研發鍊條的證據挖掘、輔助決策及效能提升,為實作數智中藥邁出了重要的一步,助力大陸中醫藥事業與時俱進。

(編輯:曹學平 稽核:童海華 校對:張國剛)

繼續閱讀