天天看點

道阻且長,行則将至:搞科研,我們是認真的——資料院四周年系列報道之科研篇

知時而起,知難而進

在大約12平米的辦公室裡,資料院科學研究部首席架構師黎成權正在向韓亦舜院長彙報清華醫學研究資料平台的建設進展:“目前參與合作的機關有5家,還有5家正在談。”平台搭建工作緊鑼密鼓開展了10個月,心氣很高的黎成權認為這樣的進展速度還不夠理想。

道阻且長,行則将至:搞科研,我們是認真的——資料院四周年系列報道之科研篇

平台開發團隊與醫院資訊科人員進行資料對接合作

清華臨床醫學科研資料平台(以下簡稱:醫學資料平台)是資料院與清華臨床醫學院牽頭搭建的一個醫療資料共享平台。希望将醫院的醫學專家和校内的工科專家聚在一起,共同打造一個醫療資料共享資源池,實作醫療資料的彙集、整理和儲存,并為高校和醫學界的研究者提供研究素材,更好的發揮醫療資料價值。這個平台被比喻為“醫工結合”鴻溝上的一座橋。

“沒有人做這件事,也沒有人敢做這件事,這絕對開創了國内的先河。”清華大學生物醫學影像研究中心研究院趙錫海這樣評價資料院帶頭搭建醫學資料平台。從平台建設之初,趙錫海就被韓院長邀請參與到平台建設中來,他非常了解其意義:“現在有大量的醫療資料堆積在醫院或醫療機構,他們不能丢,也不敢用;學校的老師需要真實的資料用于醫學研究,他們有需求,但是要不到資料。必須有一個人去打破這樣的惡性循環,資料院在做的這件事真的夠大膽,如能做成,将為社會創造極大的價值。”

趙老師冠以資料院“大膽”二字,是因為他清楚平台搭建過程中的每個環節都面臨挑戰:從國家層面,資料開放共享是大趨勢;從實操層面,醫療資料的開放共享還沒有解決好法律環境的支撐。同時,醫療資料沒有明确的歸屬權,想要使用資料是否需要跟每一個患者簽訂相應的協定,這又是一個問題;資料處理環節,需要與擁有資料的部門逐一溝通,怎樣打通壁壘實作資料融合、怎樣給醫療資料脫敏、怎樣識别複雜的醫療資料都需要付出大量人力精力;研究成果環節,還涉及一個現實的問題,由醫學、工科等專家跨學科、跨領域合作,所得出的研究成果如何配置設定......

其難重重,其路漫漫。我們不禁疑問,韓亦舜院長因何決定要做這件事,且堅持要做下去。提及平台搭建的初衷,韓亦舜院長回憶道:“我曾三天兩頭往醫院跑,去參加醫生的讀片會、去纏着醫生看電子顯微鏡下的病理切片、去與科室主任交流,甚至去參加患者及家屬組織的活動。别人總問,你不懂醫,為什麼要做這些?我是去傾聽,去思考應該從哪裡破局健康醫療大資料,去觀察醫生間的知識是如何傳承的,去了解患者的真實需求是什麼,去發現醫生最不想做又不得不做的事情是什麼?有一次看到他們統計病理切片中的細胞數量,研究人員在顯微鏡下觀察,手中拿着計數器一下一下按鍵計數。當時給我的觸動非常大。縱然醫學領域很多複雜功能暫時難以用機器智能解決,但這樣統計細胞數量,利用資料科學領域的圖像識别是有可能解決的事情。當時我就下定決心,要實作醫工結合,而且無論如何都要做成。”

道阻且長,行則将至:搞科研,我們是認真的——資料院四周年系列報道之科研篇

董家鴻和韓亦舜共同簽署合作協定

清華長庚醫院作為搭建醫學資料平台的合作方,正是因為清華大學臨床醫學院院長、北京清華長庚醫院執行院長董家鴻院士在抱有同樣的初衷下與韓院長一拍即合。董家鴻說,這樣一個資料融合的平台想做起來太難,面臨很多否定和阻礙,隻有資料院是從始至終無條件在支援推動醫工結合,也正是資料院這股“韌勁兒”打動了他。董家鴻和韓亦舜都抱有同一個信念:這件事意義非常,我們要做下去,且要做好。

目前依托清華長庚醫院的“單中心多病種平台”和聚焦肝膽疾病的“多中心單病種平台”都有了雛形,校内老師的目光陸續投向了這裡。

千淘萬漉雖辛苦,吹盡寒沙始到金

在坎坷探索醫工結合之路的同時,資料院在交通大資料領域的研究也在艱難推進。“要加快建設交通管理大資料分析研判平台,提高預測預警能力;要推廣應用交通內建指揮平台,逐漸實作道路狀況自動感覺、交通态勢自動研判、路況資訊自動釋出等功能……”2018年年初,貴州省舉辦的交警系統貫徹全國公安廳局長座談會精神動員部署會上, 公安部副部長李偉在講話中強調了資料科學在交通領域的應用。而他作為典型提及的大資料分析研判、應用交通內建指揮等平台或功能正是資料院交通大資料研究中心貴州省合作的研究:複合型大資料交通态勢感覺智慧指揮中心。

複合型大資料交通态勢感覺智慧指揮中心是資料院交通大資料研究中心團隊與貴州省公安廳交通管理局合作開展的課題研究,專注于利用交通仿真、大資料學習、機器學習和深度學習技術,融合多達100類跨界多類型、多源頭大資料,實作交通态勢和交通風險的感覺,将交通安全管理從被動的事後應對處置轉變為交通風險的主動的事前預警處理、事中快速疏導,進而降低交通事故死亡率,優化交通管理和治理,更好的服務人民群衆。

道阻且長,行則将至:搞科研,我們是認真的——資料院四周年系列報道之科研篇

胡主任與團隊成員在讨論交通風險預警系統

“現在的系統還不完美,但是已經有過小試牛刀。例如去年發生的黃果樹瀑布擁堵事件,我們通過感覺交通态勢和發送風險預警,成功規避了潛在的交通事故,化解了各類危機。”資料院交通大資料研究中心副主任胡慶勇提起他們在做的事,自然流露出自信和驕傲。當時臨近春節,胡總和他的團隊已經打響了春運安全保障實戰:“每當别人放假的時候,就是我們最忙的時候。”胡總說,“因為我們搞的是交通管理大資料,我們做的風險預警早一秒都有可能避免一場交通事故,這是人命關天的事。”為了跟春運搶時間,團隊大部分成員都從北京轉移到貴州省交管局科研所的辦公室辦公,每天加班到深夜。今年春運期間,他們總共發起了135次智慧誘導任務,惠及了700多萬人,後期資料分析也表明了誘導效果是明顯的,收到誘導資訊提示後延遲出行的交通參與者比例達到14%以上。

清華“出身”的胡慶勇思維靈活、語速飛快、極注重效率,他對自己的團隊要求非常嚴格:“資料時代的技術、應用都日新月異,我們在做的事情沒有前車之鑒,必須要拼速度、拼實力才能向前走,不然就等着被淘汰。”他同樣也強調情懷,因為中心在做的研究在全國都屬于開創性的工作,每一步的推進都要克服諸多難關,沒有情懷,不可能堅持下來。他針對資料源舉例道:“做交通大資料領域的研究,得收集電信營運商、交管局、網際網路門戶等各類資料,但是人人都謹慎,最初我們沒有成果,得讓對方知道我們要做什麼,讓對方認可我們的價值。此外,部分資料是不開放的,需要我們部署相關系統遠端處理資料再拿來用,進而實作客流分析。實作過程非常艱難,耗費了大量的人力物力成本。”

道阻且長,行則将至:搞科研,我們是認真的——資料院四周年系列報道之科研篇

胡慶勇與團隊成員在貴州省交管局的辦公室讨論工作

資料院交通大資料研究中心由清華大學教授、清華大學交通研究所所長陸化普領軍,憑借其深厚的學術科研背景為國家交通管理大資料提供“智庫”支援;有企業經曆的胡慶勇擔任中心副主任,充分發揮企業優勢,使得中心能夠以問題引導,讓科研落地到實際應用。目前,中心在貴州、内蒙、雲南等多地進行了科研部署,也終于從零逐漸突破到一。細數這些年的工作和進展,胡慶勇感慨萬千:“我一直非常認可資料院RONG的理念,隻有大家都擁有包容、融合的心态,資料才能夠被更好的開發利用,發揮更大價值,我們的工作也會有更快的進展。我的小目标是拿(jian)下(li)十個不同環境類型的省份(合作關系),讓清華資料院的交通大資料研究中心,在省域交通管理領域占有一席地位。那時候我們中心就牛了。韓老師還曾答應會重重獎勵我,嘿嘿。”

在資料的彙聚和應用領域,貴州交警走在了前面,清華資料院的理念與技能會支援貴州交警繼續引領大資料的應用。

要高峰,也要高原

采訪中,無論是劉惠琴、董家鴻、趙錫海這幾位資料科研平台建設倡導者的代表,還是黎成權、胡慶勇等資料科研平台建設實踐者的代表,都負有強烈的使命感和責任感。

“這是一個必須帶着情懷才能堅持做下去的事情。平心而論,搭建這樣的資料平台,特别是早期的工作,的确沒有多少學術價值。很多人問過我:這些代表清華的水準嗎?對資料院有什麼意義?”經過長長寂靜,韓老師接着說“我真不知道該如何回答。我認定,它對清華基于資料驅動的科研有意義,對大資料的應用落地有意義。從醫生們、老師們興奮的眼神中,從合作夥伴步步提高的成績中,我堅信它有意義。我就去做吧,資料院就去做吧。”

事實上,資料院始終在為這一目标努力着,例如與臨床醫學院合作搭建的清華臨床醫學科研資料平台、與計算機系和法學院共同搭建的司法資料平台等都在進行不同領域的資料彙集,但這終歸是一個長遠的目标,推進起來不容易。韓亦舜表示:“一方面我們還沒有較為完善的資料使用和管理規範,一方面不同領域、學科的人需要很好的溝通了解才能進行有效合作。想要推進這件事,沒有速成方法,就要靠不斷溝通、探索和嘗試。這些事情如果沒人肯幹,我們國家的大資料研究和應用落地都難以推進。是以我打定主意要做破局的那個人。在科研方向,資料院歡迎所有人以資料院作為平台開展研究,當然資料院也要求來這裡的人必須擁有開放的心态。資料融合是發揮資料價值的第一步,做成了我就值了。如果我不做,總覺得是我的遺憾。我不想留下遺憾。”

清華文化中,“自強不息”固然說的是清華人的奮鬥精神,“厚德載物”更是展現清華人對自我的要求,說的是情懷。“引領一流大資料科研”是資料院的使命,也是清華大資料人的使命。如今的資料院在科研方向逐漸實作從零到一的突破,但這一切僅僅是開始。面對資料科學這條雄關漫道,資料院始終不忘初心,向前邁進。

今天的清華科研,要高峰,也要高原,要頂天,也要立地!我們來了,我們是認真的。

原文釋出時間為:2018-04-20

本文來自雲栖社群合作夥伴“

資料派THU

”,了解相關資訊可以關注“

”。

繼續閱讀