天天看點

大資料時代,推倒“資料煙囪”何以這麼難

一直以來,科研資料都被視作生産者的“私産”,盡管越來越多的研究團體發現了資料共享的好處,可以通過開放資料通路和使用的合作,使其學科取得了重大進展,但大範圍、海量科研資料的開放共享依然是多年以來一塊難以融化的“堅冰”。

近日,中國科學院為紀念科學資料庫建庫30周年,正式對外宣布其“十二五”期間建成的科學資料雲将面向科技界和企業研發人員免費開放共享。

提起科學資料雲不得不提到中科院科學資料庫,作為中科院科學資料庫重大工程項目的直接參與群組織管理者,原中科院科學資料庫辦公室主任李望平從1987年便參與到“中國科學院科學資料庫及其資訊系統項目”的建設中。

“與現在社會上其他資料不同的是中科院科學資料庫儲存的大部分資料都是在長期的科研活動中産生的實驗、觀測和研究結果等科研資料,是國家的寶貴财富。”李望平告訴記者,科學資料庫的建設是屬于科學的基礎性工作,要通過長期持續的資料積累才能展現出其内在的應用價值。

多年來,中科院一直在推動科學資料庫的共享和應用服務,目的就是讓這批寶貴的科學資料資源為社會發揮更大的作用。

從最初的14家建庫機關、21個資料庫,發展到“十二五”期間58家機關、1340個資料庫,中科院科學資料庫整合了從資源學科領域到植物學科領域等多領域資料庫資源,提供共享資料量已從2.68gb增加到655tb,年均線上通路超過千萬人次。名稱也從最初的“中國科學院科學資料庫及其資訊系統”變成了“科技資料資源整合與共享工程”。

“現在,中科院科學資料庫已經實作由資料積累和軟硬體建設向環境建構、工程化項目向持續化發展轉變,以雲服務模式為基礎,形成了支援科研活動與科技創新的資料雲,并從基礎設施、資料資源、應用平台三大類服務的角度整合內建了各類資源和服務。”作為第四代科學資料庫牽頭機關和支撐機關主要學科帶頭人的黎建輝思考更多的是,如何運用迅速發展的資訊技術推進中科院乃至我國的科研資訊化和科技創新。

“多年來,我們一直強調科學資料庫要面向社會提供應用服務。”李望平透露,中科院科學資料庫是最早實作在網際網路上提供科學資料查詢和資料下載下傳服務的。

“中科院資料雲的開放更多的是一種引領,是一種率先行動,是一種為國家科技創新服務的必然。”在黎建輝看來,國家項目資助的科學工作者有義務通過創造和傳播新知識,為公共謀福利,而關聯資料是知識的固有成分。能夠為已發表科學結論提供證據的資料,應以智能開放的形式同時公開。

事實上,在開放共享的道路上,中科院一直在行動。以生物資訊學分子資料分析環境、地理空間資料雲、dviz大資料可視化等應用的推出,創新和發展了多學科領域資料、模型及雲服務應用的技術手段與服務模式。

2015年8月,中科院計算機網絡資訊中心成功申請并獲批我國首批試點網絡連續性出版物,創辦《中國科學資料》期刊,推動科學資料出版與資料引用,進一步促進我國科學資料資源的開放與共享。

在服務科研的同時,中科院資料雲還面向社會需求不斷加強産業化創新服務,提升拓展技術優勢。在交通管理、食品安全、新材料研發等公共領域,與國家發改委、食藥監總局、北京地稅等三十多家企事業機關開展相關合作。

本文轉自d1net(轉載)