天天看點

YRCloudFile 推進高效醫療,精準部署存儲解決方案

目前,我們正處于一個資料爆炸性增長的時代,随着資訊化新技術的不斷發展,雲計算、大資料的不斷深化應用,使得醫療資訊化快速發展。由于近幾年來疫情的反複,更是推動了遠端診療、移動診療、醫療物聯網等拓展場景的使用和網際網路醫院的開展。随着實體醫院将診療活動延伸至網際網路端,資料共享和流通成為剛需,各種資訊系統在醫療機構的廣泛應用以及醫療裝置和儀器的數字化,使得醫院資料庫的資訊容量不斷膨脹。

如何使這些海量的資料更好地為醫療衛生行業的管理、診療、科研和教學服務,已經成為人們越來越關注的話題。

YRCloudFile 推進高效醫療,精準部署存儲解決方案

以資料為中心,打造全周期流轉的醫療企業

雲和網際網路幾乎是任何一家醫療機構都不可回避的話題,對于醫療機構來說,雲營運商會進行雲上網絡安全的服務覆寫,資料存儲、安全共享,實作網際網路醫療是一個核心命題。

2019年,國家衛健委又提出智慧醫院及《智慧服務分級評估标準體系》。明确了智慧醫院中,包含智慧醫療、智慧服務和智慧管理三個方面。而這三個方面的特征就是泛在、共享和智能,這三個特點歸結到一點,就是資料的核心作用。以醫療影像為例,一份普通 CT 圖像含有大約 150MB 的資料,一個标準的病理圖則接近 5GB,而每年都有數十 TB 的資料規模增長。資料規模持續增加的同時,核心應用的資料量越來越大,伺服器的性能要求也越來越高,存儲架構和運維架構則越來越複雜,資料存儲逐漸出現讀寫速度慢、延時高、存儲空間受限等問題,需要不斷擴容來優化。由此,以資料為中心成為醫療行業發展的重要方向,存儲系統需要充分發揮自身新型基礎設施的價值,對醫療建設具有重要意義。

為此,我們将基于一家在全球領先的醫療裝置擁有核心研發和制造的制造廠商為案例,業務覆寫生命資訊與支援、臨床檢驗及試劑、數字超聲、放射影像等四大領域,通過分析原有的資料存儲架構,幫助該企業找到存儲難題并設計出針對該場景的問題解決方案。

海量資料下亟需解決的三重困境

臨床醫療裝置的研發和制造對資料存儲、通路及安全都提出了更高的要求。此外,随着醫療資料量的激增,如何根據資料全生命周期,将資料做自動流轉、存儲和管理,也成為了建設中所面臨的問題。為了更好地實作内部體外診斷營運管理部、醫學影像營運管理部、生命資訊與支援營運管理部的研發資料共享和協作,提升企業各研發部門資料的統一存儲和管理,通過用高性能分布式存儲架構替換原有傳統存儲架構成為其首要選擇,進而實作研發資料的自主可控性。在使用本地傳統存儲方案中,該企業面臨性能、資料可擴充能力以及資料共享安全性等考驗:

問題一:運維管理複雜,存在單點故障,資料丢失風險

該企業研發部門的資料是整個企業的關鍵資産,資料安全則是企業最優先考慮的問題。除了在使用網盤本身的強制備份、對網盤用戶端的權限精細化管理、版本管理及審計追溯管理以外,通過原有的傳統存儲方式(單機伺服器等)存儲資料均存在單點故障問題;還會面臨硬碟/伺服器故障造成的資料丢失及業務中斷的風險,一旦洩露或中斷會破壞企業多年的研究成果。

問題二:企業員工數量多,并發通路量大,存儲擴充能力跟不上需求

目前該企業在全球設有 10 個研發技術中心,共有 3400+ 名研發專家,其中包含海量的圖檔、視訊、語音等非結構化資料。然而傳統存儲體系,通過原有 NAS 的方式,其讀寫性能低,在業務并發頻繁通路資料時,很難支撐海量的資料存儲需求,更難以面對資料量激增的問題。使用傳統存儲作為研發資料的網盤後端存儲,當存儲空間達到飽和時,會造成業務中斷,則需要通過調整網盤業務系統或者通過遷移資料的方式來支援多存儲單元,是以存儲平台的可擴充性是十分重要的。

問題三:資料量龐大,存儲性能低

作為研發部門的網盤後端存儲,後續則需要承載海量的研發資料。傳統檔案存儲采用 B+ 樹進行檔案檢索,随着檔案數量和層級深度的增加,資料的通路性能會急劇下降,直接影響研發資料存取效率。

焱融科技高性能檔案存儲,助力醫療企業安全共享

在深入了解該企業實際業務後,我們的架構工程師根據需求模拟不同場景下所面臨的難題,針對該企業研發資料網盤私有化部署場景,推薦使用 YRCloudFile 高性能分布式檔案存儲解決方案。通過使用分布式 Raid5 + 雙副本的存儲政策,利用分布式架構來取代傳統依賴 NAS 的架構,從根本上解決企業所面臨的問題。

一方面,在資料安全性上相比傳統 Raid 模式或雙副本模式更可靠;另一方面,分布式存儲架構在性能上也有所保障,企業可以根據自身容量按需擴容,使得其在原有存儲上有質的改變。通過提升和改造原有的存儲架構,使可靠性、性能和經濟性三者兼顧。

在整個方案過程中,焱融科技 YRCloudFile 高性能分布式檔案存儲提供了強力的支援,主要優勢表現在:

保障研發資料​的安全性

将研發資料從雲上及邊緣端移到資料中心内,降低了企業 IT 部門所面臨的安全問題。資料通路集中化能夠緩解資料洩漏和失竊的風險,并有效地簡化合規性工作程式。通過使用高性能檔案存儲 YRCloudFile 分布式 Raid5 + 雙副本的存儲政策,先将伺服器本地硬碟組成 Raid 組,然後 YRCloudFile 存儲系統通過複制協定來保證資料副本的一緻性。隻有當資料的所有副本都寫入成功後,才會傳回前端資料。存儲系統可以保證每個副本上的資料都是完全一緻的,從任意副本讀到的資料都是相同的,進而可容忍不同 Raid 組的多塊硬碟故障或者伺服器故障。本次 Raid5 + 雙副本的存儲政策不僅為項目的研發資料應用提供高達 99.995% 的服務可用性,而且還達到了 99.99999% 的資料可靠性,為企業研發資料安全增磚添瓦。

提升資料通路性能

通過 YRCloudFile 分布式中繼資料橫向擴充架構,利用虛拟目錄、靜态子樹和目錄 Hash 等技術,實作在 0-100 億級别的海量檔案背景下,檔案操作性能和檔案的讀寫性保持平穩狀态,并完美支撐上層應用。

其主要包含三大要素:

  • 将根目錄固定在 MDS 節點;
  • 每一級目錄會根據 Entry name 進行 Hash,再次選擇 MDS,以此保證橫向擴充的能力;
  • 在目錄下檔案的中繼資料進行存放過程中,不再進行 Hash,而是跟父目錄在同一個節點,以此保證一定程度的中繼資料本地性。

此種架構方式有兩種好處,首先中繼資料的分布存儲,通過擴充中繼資料節點,即可支援百億級别的檔案數量;其次減少在多個節點上進行中繼資料檢索和操作,靈活的分布式架構以及高效的中繼資料算法,将底層伺服器的性能有效地發揮出來,為研發部門網盤應用提供極緻的 IOPS 及存儲帶寬,保障存儲性能不衰減。

實作性能及容量經濟性擴容

傳統 NAS 存儲容量及性能的擴充受制于控制器,其橫向擴充能力較差,無法實作無限制擴充,控制器架構使研發資料的網盤規模受限。

YRCloudFile 推進高效醫療,精準部署存儲解決方案

架構對比圖

YRCloudFile 将多台伺服器上硬碟的讀寫能力聚合形成聚合帶寬,搭建通用 X86 伺服器,實作軟硬體解耦,可按需部署,靈活擴充,使存儲系統總體性能呈線性增長。企業後續可通過增加伺服器的方式,提升整個存儲系統的容量及性能。

繼續閱讀