天天看點

醫院主導人工智能研究面臨的技術性挑戰:從政策推動到研究産出

作者:科學參考
醫院主導人工智能研究面臨的技術性挑戰:從政策推動到研究産出

原文刊載于《中國科學院院刊》2023年第4期專題:技術經濟安全理論與實踐。原文标題《從政策推動到研究産出——淺析醫院主導人工智能研究的技術性挑戰》。本文為精簡改編版。

莊昱1,2 周程1,3*

1 北京大學 哲學系

2 北京大學第三醫院

3 北京大學 醫學人文學院

近年來,人工智能(AI)正在加速融入醫療健康相關研究中。醫院是大陸醫療健康領域重要的人工智能研究基地與産出基地。目前,對醫院主導人工智能研究現狀調查尚不充分。本文對醫院主導人工智能研究的現況進行研究,分析醫院主導人工智能研究需要面對和跨越的技術性難題,并針對性地提出管理建議。

1 政策推動醫院開展人工智能研究

大陸高度重視人工智能在醫學中的研發與應用,将其作為新一輪科技革命和醫療健康産業變革的核心驅動力,并力圖在新一輪科技競争中搶占主導權。2022年,國家衛生健康委員會與各省份簽訂的《共建高品質發展試點醫院合作協定》中明确,要聚焦數字賦能,加強大資料、人工智能等跨行業新技術應用,建設醫療、服務、管理“三位一體”的智慧醫院。“十四五”期末,試點醫院形成中國智慧醫院樣闆;“十五五”期末,面向世界提供智慧醫院建設中國解決方案。

醫院采用人工智能技術開展研究,有機會産出引領性、颠覆性的科技進步。人工智能研究範式可擴充納入研究的資料模态,增加資料量,并加速資訊采集過程。與此同時,醫院是醫療健康資料的重要生産基地;醫院研究者更加貼近患者,更容易提煉出具有重大科學意義的醫學問題及技術需求。

人工智能臨床應用研究已成為國際醫學研究的重點方向和競争熱點。國際一流醫院也在努力布局人工智能的研發與應用。2022年,美國《新聞周刊》(Newsweek)和德國Statista調查公司釋出了“世界智能化程度最高的300家醫院”榜單。該榜單中排名前10位的醫院中,有5家醫院被特别地标注了以“人工智能”為代表性領域。

2 醫院人工智能研究數量及品質分析

樣本醫院

本研究選擇北京協和醫院、北京大學第三醫院、四川大學華西醫院、香港大學深圳醫院等14家國家公立醫院高品質發展試點醫院作為樣本。這14家醫院感受到的政策推動更強,因而具有典型性,也具備一定程度的代表性。

研究方法

本文采用定量研究方法,對發表文章和申請專利2個次元開展了研究。

發表論文方面,研究者對樣本醫院發表人工智能相關文章進行了統計,采用關鍵詞法在前述文章中識别人工智能相關文章,中英文關鍵詞包括“人工智能(artificial intelligence)”“機器學習(machine learning,ML)”“神經網絡(neural network)”“支援向量機(support vector machine,SVM)”“卷積神經網絡(convolutional neural network,CNN)”“殘差網絡(residual network)”等。

專利申請方面,研究者從國家知識産權局網站“專利檢索及分析”系統檢索了相同時間段内獲批的、包含“人工智能”關鍵詞的相關發明、實用新型專利項目,并對其數量進行統計。

發表論文分析

1

論文數量

樣本醫院在2018—2019年、2021—2022年共發表人工智能相關研究文章3002篇,占比僅為2.25%。樣本醫院參與人工智能研究文章數從2018年的222篇逐年增長至2022年1434篇(圖1),但2022年的同比增速(53.70%)遠低于2019年的同比增速(86.04%)。結果提示,醫院參與人工智能研究可能遇到了一系列挑戰,發展可能進入瓶頸期。

醫院主導人工智能研究面臨的技術性挑戰:從政策推動到研究産出

圖 1 14家樣本醫院發表人工智能相關研究論文總數量及在總發表論文數中的占比

2

發表語言

以中文作為發表語言的論文數占比從35.59%逐年下降至15.34%,且各年占比均低于全部領域文章中中文語言占比(圖2)。結果提示,醫院的人工智能研究更傾向于發表在國際期刊上。

圖 2 14 家樣本醫院發表醫學領域和人工智能相關研究中文論文占比對比

3

第一作者

本文以第一作者機關是樣本醫院的文章數量作為衡量醫院主導人工智能研究的名額。樣本醫院主導發表了1728篇人工智能研究論文,占參與人工智能研究數的57.56%。結果提示,相當多的研究并非由醫療機構主導。

表1 樣本醫院主導人工智能研究發表論文數及在總發表數中的占比

醫院主導人工智能研究面臨的技術性挑戰:從政策推動到研究産出

4

研究層次

約55%的研究(67.29%的中文文章和45.92%的英文文章)僅以“人工智能”或“深度學習”或“機器學習”作為關鍵詞(圖3)。結果提示,這些文章大多尚停留展望、讨論人工智能可能應用于某領域的較淺的研究層次上。

醫院主導人工智能研究面臨的技術性挑戰:從政策推動到研究産出
醫院主導人工智能研究面臨的技術性挑戰:從政策推動到研究産出

圖 3 樣本醫院發表中文(a)和英文(b)論文的人工智能關鍵詞占比

人工智能相關專利

2021年以來,多家試點醫院人工智能專利授權數實作了0的突破,總量也從2018—2019年的2件提高到了2021—2022年的46件(表2)。結果提示,人工智能研究轉化專利數量較少且不穩定,并未形成穩定的人工智能研究計劃及産出。

表 2 樣本醫院人工智能相關授權專利數(機關:件)

醫院主導人工智能研究面臨的技術性挑戰:從政策推動到研究産出

3 醫院主導深度人工智能應用研究的挑戰分析

學習曲線陡峭

1

系統學習深度神經網絡範式

深度神經網絡範式由一系列互相關聯的技術路線和細節構成,知識容量較大。醫院研究者完成深度神經網絡範式的系統性學習,往往隻能利用工作之外的業餘時間自學或參加相關教育訓練班。

2

學習程式編寫

1. 程式設計環境配置的挑戰。人工智能的架構處在快速的更疊之中,前一代的功能可能在後一代版本中被直接取消。初學者需要花費很長的時間,才能找到對應的解決方案。

2. 程式設計和排除程式設計錯誤的挑戰。人工智能研究則需要研究者從零撰寫程式,包括導入中層架構,加載必要基礎子產品等;排除程式錯誤通常會花費比編寫程式更多的時間。

3. 多模态資料挑戰。研究者不得不學習将這些資料導出、輸入到人工智能程式中需要的程式設計技能。

計算機相關英語語言能力

目前,高品質的人工智能入門書籍都以英文書寫,由于翻譯、出版存在周期,這些著作中援引的學習資源甚至中層架構都發生了變化。這也從側面印證了前文的發現,即越來越多的人工智能研究成果以英語語言發表在國際期刊上。

疊代計算産生時間和硬體成本

疊代成本主要可以分為時間成本和硬體成本2類,且這2類成本可以在一定程度上互相轉化。

1

時間成本

機器學習算法通過自動疊代計算來獲得神經網絡模型的最優參數解,使用成本較低、普及度較高的中央處理器(CPU)計算需要耗費較長的時間。

2

硬體成本

相比CPU,使用價格更高的圖形處理器(GPU),可以大幅減少計算需要付出的時間成本。由于多數醫學圖像的辨析度較高、圖層數較多,醫院主導人工智能研究幾乎難以避免地需要添置GPU,有時還需要添置與之比對的專門的計算平台。對醫院的人工智能技術潛在研究者而言,擷取與研究設想相比對的計算硬體資源是一項難度相當大的挑戰。

将臨床資料轉化為高品質研究資料

1

臨床生産的資料同質化水準不高

在品質同質化較低的醫院中,生産圖像的平台科室隻需確定圖像中包含有助于醫師診斷疾病的部分即可。在人工智能技術中,圖像的背景、亮度、色溫,乃至研究興趣區在畫幅中的位置、大小、角度等因素都可能産生噪聲,幹擾信号的提取。

2

儲存、脫敏、提取、傳輸等資料處理相關問題

靠近采集端的資料的體量遠大于經過提取後的結構化資料,對資料進行提取、傳輸、備份等操作會産生可觀的成本,是以,醫療機構往往不願在挖掘資料中進行更多的投入。

3

資料标記

缺乏大規模高品質标注訓練資料集是現階段制約大陸人工智能臨床應用研究發展的關鍵因素。實際上,在傳統的數理統計方法的研究中,研究者也需要花費相當多的工作量識别和标記圖像關鍵點。是以,固然标注資料是目前人工智能技術應用中需要關注的問題,卻不是伴随人工智能技術而新出現的問題。

人工智能的可解釋性較弱,使臨床應用信心不足

1. 深度神經網絡的研究結果往往由一系列對模型拟合能力的名額和預測能力構成,對熟稔傳統數理統計的醫院研究者而言,對人工智能結果進行解釋和闡釋的難度較大。

2. 一些旨在解決可解釋性挑戰的可視化算法(例如GradCAM)的技術難度很高。醫院研究者及團隊很難依靠自身力量将這些技能内部化。

掌握團隊資源、确定團隊技術路線的團隊帶頭人,面對人工智能可解釋性較弱的特性,将很難下決心組織開展深層次研究與應用。

4 從政策推動到研究産出的管理建議

抓住研究範式轉變機遇,引導投入研究資源

雖然人工智能面臨着可解釋的挑戰,但也應認識到,沒有一種研究方法是完美的。隻有面向人工智能研究投入資源才可能逐漸克服和優化解釋問題。

國家層面,應面向人工智能發展過程中的難點和痛點,通過設定綜合醫院的國家人工智能醫學研究中心,設定網際網路醫院、智慧醫院等樣闆醫院,培育公立醫院在發展人工智能中的良好的競争文化,實作“彎道超車”的政策推動目标。

醫院層面,優化人工智能研究領域的資源投入,通過開設人工智能課堂、組建院級人工智能計算共享平台,設定專門孵育項目等方式,面向人工智能的技術性挑戰,審慎組織,跨越人工智能技術性障礙。

面向人工智能技術,布局多模态資料資源

醫院應主動布局多模态資料資源結構,采取更加開放的态度,允許研究項目獲得小規模的患者資料作為資料集。創新條件較好的醫院可搭建人工智能資料平台,允許經研究團隊标注的小規模樣本集對院内研究者開放,供研究者熟悉和優化改進資料集。

醫院内的研究團隊可根據研究資源主動參與多模态資料布局。資源較豐富的醫院研究者團隊可嘗試使用無監督學習聚類等機器學習算法,提前對資料進行小規模嘗試性歸類與标記。掌握研究資源不豐富的研究者可在使用傳統統計方法進行病例研究的同時,留意收集該病例的多模态資料,逐漸嘗試納入多模态資料并應用人工智能方法拓展研究。

培養人工智能協調員,推動人工智能研究走向深入

部分高品質發展試點醫院也已啟動了高校、科研院所和醫療機構之間的合作。但無論是研究建議還是實踐,均未聚焦擔任團隊間“橋梁”的院内工作角色。醫院應着力培養了解人工智能的基礎架構、知識點,具備初步的人工智能研究能力的人工智能協調員,更好地溝通研究需求與研究方法,不斷推動人工智能研究走向深入。

5 結語

醫院參與和主導的人工智能研究數量正在逐年增加,醫院研究者對人工智能研究範式的熱情越來越高漲,投入也越來越多。醫院主導人工智能研究仍面臨重要的技術性挑戰:人工智能技術學習曲線陡峭、疊代成本高、高品質多模态研究資料難得和可解釋較弱。醫療機構應當主動響應政策推動,調動内部資源,主導人工智能技術内部化。未來,可通過培養人工智能協調員,培育人工智能高端人才,面向人工智能技術布局多模态資料資源,促進研究産出。

莊 昱 北京大學第三醫院管理助理研究員,北京大學哲學系在讀博士。主要研究領域:科學技術哲學。

周 程 北京大學哲學系教授、醫學人文學院院長。國務院學位委員會科學技術史學科評議組成員。研究領域為科學社會史、科學技術與社會、創新管理與科技政策。

文章源自:莊昱, 周程. 從政策推動到研究産出——淺析醫院主導人工智能研究的技術性挑戰. 中國科學院院刊, 2023, 38(4): 643-653. DOI:10.16418/j.issn.1000-3045.20230111001

繼續閱讀