老齡化程序的加速正在引起中國疾病譜的深刻變化。相關資料顯示,2020年大陸新發癌症人數、癌症發病率和死亡率将居世界第一。在未來5—10年内,大陸癌症患者人數将顯著增加。
篩查和早診斷早治療是預防和控制癌症的有效途徑之一。“早診”的關鍵是擴大病理診斷的可及性,提高病理診斷的準确性,提高基層醫療機構病理診斷水準。
病理診斷是疾病診斷的“金标準”,但培養一名合格的病理醫生需要較長的時間。資料顯示,到2021年底,大陸注冊病理醫師将達到2.5萬人,其中能獨立完成病理診斷的醫生不足8000人。病理學家從畢業到獨立,往往需要“十年磨一劍”。是以,很難在短期内填補超過100,000病理學家的空缺。
從地區分布來看,80%的病理醫師集中在大城市,70%集中在三級醫院。一方面,三級醫院的病理科超負荷運轉,醫生過度疲勞,已經成為常态。以三級醫院病理科為例,每天需要承擔3500多片病理診斷任務,年切片總量超過100萬片。
另一方面,基層病理診斷資源嚴重缺乏,診斷符合率低。目前,二級醫院病理診斷符合率為35%,縣級醫院僅為26%。。病理診斷“含金量”不足,是惡性良性腫瘤等疾病過度治療或治療不足的主要原因。
大陸病理學界已經意識到,推進數字化病理是解決病理資源供需不平衡的關鍵途徑:将玻璃切片轉化為數字化切片,再進行數字化存儲和數字化診斷,有利于遠端病理學、人工智能輔助診斷、病理學大資料研究。為提高診斷效率,減少漏診、誤診,解決病理資源分布不均等問題。
回顧過去的十多年,病理科的數字化程序相對于檢驗科和影像科的數字化程序相對滞後。究其原因,是數字病理學的關鍵技術需要突破。這些關鍵技術包括:全數字化病理資訊系統、數字化病理存儲壓縮算法、多模态智能病理輔助診斷算法等。
以資料存儲系統為例,它是提供數字切片閱讀服務的基礎IT基礎。由于掃描的數字幻燈片是基于傳統算法壓縮的,切片檔案一般在1—3 GB左右。-2PB數量級不斷增加,需要存儲15-30年,存儲成本快速上升。
更重要的是,傳統的存儲解決方案使用的對象存儲具有很高的協定開銷。病理切片的檢索速度慢,容易出現延遲、拼接等問題。從拖動圖像到正常顯示甚至需要幾十秒的時間。影響病理學家讀片的效率和準确性。同時,檔案過大導緻網絡傳輸速度慢,難以開展對實時性要求較高的業務,如遠端術中冰凍病理診斷。
“數字化智慧病理科”的建設不可能一蹴而就,需要經曆資訊化、數字化、智能化三個階段。
第一步是資訊化,即在資訊管理系統的基礎上對傳統病理工作流程進行全面的數字化更新。
第二步是數字化,即以數字化切片為基礎,實作病理診斷及相關的數字化病理應用。重點需要解決的問題是數字切片閱讀當機,和高存儲成本。
第三步是智能化,是在人工智能與病理工作流程有機融合的基礎上,現高效的人工智能輔助診斷。同時,利用人工智能對病理資料進行深度學習和挖掘,發現新的疾病特征和治療方法。發展與創新提供了新的思路和方法。
基于“三步走”的路徑藍圖,“數字化智慧病理科”可以将科室日常産生和處理的所有病理資訊完全數字化、智能化,實作整體病理生态系統的數字化建設。
“要打造數字化智能病理科,單靠病理科或IT團隊是做不到的。隻有多方合作,組成一個團隊,解決數字病理學的關鍵痛點,才能做到這一點。“為此,将重點任務進行了分解,并将其分為四個重點任務:幻燈片閱讀的數字化、科室管理資訊化,高效資料管理,智能診斷和品質控制,需要病理研究、硬體支援、資訊管理系統、存儲等多個團隊參與壓縮算法和人工智能技術。
提高診斷效率。是在數量多、難度低、重複性高的正常切片診斷中,數字圖像讀取可以有效地減少醫生的重複勞動,提高診斷效率。以消化道内鏡活檢的小标本為例,傳統顯微鏡讀數。
報告期為3個工作日,目前醫院已将其縮短為2個工作日。在解決疑難問題方面,借助AI技術的深度學習能力,AI算法在消化管活檢中判斷小病竈的敏感性和特異性較高。
提高管理效率。全過程的數字化品質控制,不同程度地提高了病理科的标本流通效率、生産品質和生産效率。
授權臨床研究,病理科資訊化、數字化建設提高了病理資料品質。建立了數字化智能病理輔助服務平台,覆寫了多個病理AI技術領域,建立了亞專科資料庫,擴充了前列腺癌、淋巴瘤、肺癌等亞專科疾病的AI模型,為“下一代病理技術”奠定了基礎。
利用全流程自動化、數字化輻射到醫療聯盟内的分支醫院和醫療機構,為國家/省級區域醫學中心建設提供參考,帶動基層醫院提高病理診斷水準,進一步提高普通患者擷取優質病理診斷資源的可及性,實作醫院就在你隔壁,病理科就在你身邊。
三大創新帶來病理資料管理的科技革命
“數字化智能病理科”的建設需要解決海量數字化切片的分析效率、閱讀體驗和存儲成本等問題。病理資料管理的技術革命正在發生。
資料存儲産品線秉承“為場景找技術,為技術找場景”的宗旨,将數字技術與病理業務場景深度融合,推出首款支援醫院級讀取和病理無損的“數字病理存儲系統”。壓縮算法在病理資料的高性能擷取和資料縮減方面實作了質的飛躍。
第一是“閱讀速度快”
對象存儲協定的開銷和通路延遲都大于檔案存儲協定,不是最好的病理存儲協定。資料存儲自主開發了“分布式并行檔案用戶端(DPC)”技術,它将分布式并行用戶端作為存儲用戶端運作在計算節點上,通過高速網絡與後端存儲節點進行資料交換,并采用智能算法大大降低通路延遲,提高吞吐量,使上層應用更智能地通路存儲空間。此方案無需更新網絡和閱讀用戶端,可有效保護現有IT投資。
将DPC技術引入病理數字化玻片的讀取中,系統在讀取玻片時可以根據浏覽需要自動比對圖層。這種方法解決了對象存儲協定開銷大的問題,實作了80倍的檢索性能提升,實作了每秒觀看1000張病理切片的流暢體驗。
從病理科醫生的回報來看,真正做到了“想看哪裡就看哪裡,不需要等待,非常流暢”,同一個切片支援多人同時讀取切片,支援包括臨床、科研、教學等所有場景。無需醫院層面的停讀片,可将病理診斷的協同效率提高70%以上。
其次是“低存儲成本”
傳統病理圖像壓縮後的平均大小仍接近1GB,病理圖像的特征和“瓦片”之間的相關性不能得到充分利用。在充分研究病理資料特點的基礎上,創新性地提出了"病理資料二次無損壓縮算法",通過智能識别算法、語義分割、參考壓縮等技術,大大提高了病理切片的壓縮率。
不同于隻能壓縮TXT文本檔案的“通用壓縮技術”和壓縮資料塊的“重複去重壓縮技術”,這種“病态二次無損壓縮算法”的本質是基于病态圖像的精确場景壓縮。在原有壓縮算法的基礎上,可節省30%的存儲空間和網絡帶寬。未來,随着算法的不斷演進,将帶來更大程度的節省空間。
此外,病理學資料具有明顯的周期性存取特征。根據資料通路頻率和熱、溫、冷進行分類,既能兼顧圖像讀取的性能要求,又能有效降低存儲成本。分層存儲技術允許同一存儲池中不同類型的實體節點劃分到不同的硬碟池中,實作熱、溫、冷資料的分層存儲和管理政策。以冷資料的藍光存儲為例,可以幫助醫院将30年病理資料的藍光存儲成本降低57%以上。
第三是“廣覆寫”
針對最需要數字化病理賦能的基層醫療機構,部署模式推出“數字化病理一體機”。
該一體機基于FusionCube 500的一體化功能,集掃描、存儲、計算、網絡、安防、人工智能六大功能于一體,集資料采集系統、病理讀取系統、病理資訊系統、人工智能輔助診斷系統、遠端病理系統等多個系統于一體。對于基層來說,隻需要一套裝置就可以獲得傳統的六套裝置才能實作的功能,進而以最快的速度、最低的成本實作基層病理科的數字化,為優質病理診斷資源的下沉提供基礎。
工欲善其事,必先利其器。未來的“數字化智能病理科”會是什麼樣子。“邁向下一代病理診斷理論”不僅依賴于數字切片,更依賴于基因資料、影像學資訊、臨床資訊等多種資料的融合應用與分析。随着智慧病理學研究的深入,病理資料存儲和管理的技術革命不斷,應用融合、資料融合、存儲融合的趨勢已日益清晰。