葛蘭素史克(GlaxoSmithKline)是一家全球制藥公司,總部設在英國。葛蘭素史克公司的使命是“幫助人們做到更多,感覺更舒适,生活更長久,改善人們的生活品質”。他們正在利用資料科學這種方法來研發可以提高人們生活品質的新藥物配方。
在DockerCon 歐洲大會上,大資料解決方案總監Ranjith Raghunath和葛蘭素史克公司呼吸系統資料科學總監 Lindsay Edwards一同分享了Docker 企業版(EE)是如何幫助他們公司通過一個名為“Edge Node”的項目來促進新藥研發的速度。
制藥研究面臨的最大挑戰是需要創造出數百種藥物配方,而其中僅有3%的藥物配方能真正的制成藥物并流通上市。Lindsay Edwards 上司的資料科學小組專注于研究如慢性阻塞性肺病 ( COPD ) 和哮喘這類的呼吸系統疾病。他的小組使用大資料分析來挖掘研究資料和以前的患者試驗資料,以便更快地得出結果。

資料科學作為一個新興領域。在市面上,總會出現一些新的軟體工具和開源資料分析解決方案,以及專門為這種類型的計算而設計的不同硬體和晶片組。然而每一種新興技術可能都需要3到6個月的時間,才能被像葛蘭素史克這樣擁有高度監管機構的公司準許使用。
Lindsay 需要一個更快的方式讓她的團隊在不同的硬體平台上安全地測試和實驗這些新技術,同時也可以讓她的科學家們能夠輕松的互相分享各自的研究成果。她的組織需要一個靈活的平台,它可以支援不同的軟體工具和應用程式,以及不同的硬體配置,同時還要可以根據需求擴充這些工具。
為滿足資料科學小組的需要,Ranjith 需要一種方法,即可以快速向各種研究人員提供新技術,而又不需要依賴基礎設施。他尋求了各種各樣的方法,最終選擇了Docker 企業版(EE),因為對研究人員來說它是最安全最高效的平台。
這些環境已經預先配置好了類似于通過Active Directory進行身份驗證等企業必備的內建軟體,但研究人員可以不受這類內建軟體的限制,仍然可以根據自己的喜好來安裝并使用适合他們的軟體。使用Docker EE可以實作完全的基礎設施獨立性和真正的應用程式可移植性,進而使Lindsay的團隊能夠從一個叢集轉移到另一個叢集,同時保持其完整性。
名為Edge Node On Demand [ENOD] 的全新解決方案,由Docker EE提供支援,并與各種Cloudera叢集和MongoDB結合。該解決方案為葛蘭素史克提供了以下5點關鍵的好處:
單一接口——标準化的Docker EE 意味着所有不同的應用程式都可以以一種一緻的方式進行處理。此外,Ranjith 的團隊利用Docker API将環境資訊整合到單一接口,該接口用于服務請求和追蹤應用程式部署的情況。
使用者隔離——每個研究人員都擁有一個與其他人隔離的實驗沙盒。在這個實驗沙盒中,他們可以大膽的進行實驗而不必擔心影響到其他人。
可複用性——如果研究人員一旦有所發現,他們就可以使用Docker EE輕松的一遍又一遍的重建并且重新部署相同的應用程式。
無縫遷移——無論是從開發環境轉移到生産環境,還是從一個硬體配置轉移到另一個硬體配置,Edge Node on Demand從真正意義上實作了跨環境的無縫遷移。
共享——Docker EE使葛蘭素史克公司能夠輕松地共享研究成果和實驗資料,提高了合作效率并且加快了研發速度。
葛蘭素史克公司的資料科學技術在最近的Hadoop Strata會議上為其獲得了“年度最佳新秀”獎。他們使用Docker EE實作了創新的傳遞模式,這使得他們提高了研究效率,并有望發現更多拯救生命的藥物。