天天看點

院士徐宗本:大資料 大智慧◆ ◆ ◆理性認識大資料◆ ◆ ◆準确把握大機遇◆ ◆ ◆

院士徐宗本:大資料 大智慧◆ ◆ ◆理性認識大資料◆ ◆ ◆準确把握大機遇◆ ◆ ◆

擁有大資料是時代特征,解讀大資料是時代任務,應用大資料是時代機遇。大資料作為一個時代、一項技術、一個挑戰、一種文化,正在走進并深刻影響我們的生活。黨的十八屆五中全會提出,“實施國家大資料戰略”。實施國家大資料戰略,必須理性認識大資料,準确把握其帶來的機遇,科學應對其帶來的挑戰,用大智慧實作大資料的大價值。

  

資訊技術革命與經濟社會活動的交融催生了大資料。大資料是經濟社會、現實世界、管理決策的片斷記錄,蘊含着碎片化資訊。随着分析技術與計算技術的突破,解讀這些碎片化資訊成為可能,這是大資料成為一項新的高新技術、一類新的科研範式、一種新的決策方式乃至一種文化的原由。大資料是指數量特别巨大、種類繁多、增長極快、價值稀疏的複雜資料,簡而言之,是“大而複雜”的資料集。作為資訊資産,大資料的價值需要運用全新的處理思維和解譯技術來實作。

大資料具有大價值。在日常生活中,大資料的價值主要展現在:提供社會科學的方法論,實作基于資料的決策,助推管理革命;形成科學研究的新範式,支援基于資料的科學發現,減少對精确模型與假設的依賴,使過去不能解決的問題變得可能解決;形成高新科技的新領域,推動網際網路、物聯網、雲計算等行業深入發展,形成大資料産業;成為社會進步的新引擎,深刻改變人類的思維、生産和生活方式,推動社會變革和進步。大資料的價值主要通過大資料技術來實作。大資料技術是基礎性資訊技術,它刻畫了新一代資訊技術中機器與機器、機器與人之間資訊交換的内容特征,構成了現代資訊技術的基本資訊處理模式。是以,大資料從資訊載體這一底層捕捉到了資訊化的共性基礎、未來發展與普适技術。這說明,大資料熱潮的來臨是一種必然,大資料技術不會是過眼雲煙。

科學了解大資料的“大”。資料的積累是一個從量變到質變的過程。當資料積累不夠多時,沒有人能讀懂這些“碎片”背後的故事。但随着資料的積累,特别是超過某個臨界值後,這些“碎片”整體所呈現的規律就會在一定程度上被顯現出來。可以認為,這一從量變到質變的臨界值是區分資料“大”與“不大”的标準。是以,大資料的“大”是相對的,是與所關注的問題相關的。隻有這樣了解,才能避免産生大資料能解決所有問題的誤讀。

科學了解大資料的“複雜”。由于具有海量性、快變性、異構性和分布性等複雜特性,大資料技術是一項不斷發展的技術,并非已經成熟。這當然并不妨礙運用現有大資料技術從現實的各種大資料中獲得價值,但我們必須清楚:大資料的價值實作是無止境的,大資料理論、技術和産業将相伴而行。這是大資料發展的基本形态。

大資料必将引領未來生活新變化、孕育社會發展新思路、開辟國家治理新途徑、重塑國際戰略新格局。實施國家大資料戰略,是對大資料意義、價值與作用的深刻認識與準确把握。那麼,大資料到底能給我們帶來什麼機遇?目前來看,大資料至少能在管理創新、産業發展、科學發現、學科發展四個領域為我們帶來前所未有的機遇。

管理創新機遇。管理和決策問題通常是難以模組化的。如今,基于大資料和大資料技術,人們可以使用極為豐富的資料資源對經濟社會發展進行實時分析,并幫助政府更好地對社會和經濟運作作出反應。大資料技術可以幫助我們實作夢寐以求的科學決策,實作科學決策具體化,進而推動管理理念、方式與方法的革命。在實踐中,運用大資料對國家政策進行預評估已成為可能。

産業發展機遇。大資料是解決衆多國家重大現實問題的共性基礎,能夠為産業發展更新提供幫助。特别是大資料技術的底層性使得它很容易與其他行業、技術嫁接,進而形成以資料為資産、以現代資訊基礎設施為基礎、以資料價值挖掘為創新要素的大資料産業。大資料可以為大衆創業、萬衆創新提供絕好平台。應用好大資料這一基礎性戰略資源,可以推動傳統産業改造更新,培育經濟發展新引擎和國際競争新優勢。

科學發現機遇。資料收集、處理與分析能力的提升,将顯著拓展人們對客觀世界洞察的深度和程式化探究問題的廣度。随着資料積累和計算能力的提升,直接從大資料中擷取知識成為可能。這種基于大資料分析的探究方式彌補了過去單純依賴模型和假設解決問題方法論的不足,形成了一種新的科學研究範式:基于資料的科學發現。運用新的範式,一些過去不能解決或解決不好的問題現在變得可能解決。

學科發展機遇。大資料時代,數理科學與人文社會科學、管理科學等學科的深度交叉融合将徹底打破和革新學科領域,統計學面臨革命,計算科學的内涵與外延将發生重大改變。一種融合統計、計算、資訊與數學的資料科學正在形成。“解讀大資料是時代任務”的要求也将深刻改變和影響各門學科。這一改變勢必對大學的學科設定和人才培養産生重大影響,尤其将為大學培養國家創新發展急需的人才提供難得機遇。

科學應對大挑戰

大資料為國家創新發展帶來了大機遇,但要真正實作大資料的大價值,特别是将大資料轉化為現實生産力,還面臨一系列挑戰。

科學基礎的挑戰。對大資料而言,分析才能出價值,關聯才能出價值。傳統用于分析關聯資料的統計學方法以抽樣資料為對象、以樣本趨于無窮的極限分布為基礎;而大資料所處理的對象是自然資料,既無明确的抽樣機制,也不大可能存在穩定的極限分布。這樣,傳統分析資料的科學基礎遭到動搖,必須重建統計學基礎、計算基礎與邏輯基礎。

計算技術的挑戰。大資料的核心技術除了依賴解譯資料自身的方法論,采取什麼樣的計算架構去存儲,采取什麼樣的計算模式去支援快速查詢與處理,采取什麼樣的程式語言和算法去完成計算、分析和挖掘,這些都面臨技術上的挑戰,必須革新計算模式和計算方法。

真僞性判定的挑戰。大資料具有大價值是無疑的,但如果從大資料中産生結論、形成決策的方法論基礎不堅實,直接運用大資料結論就可能是不可靠的甚至是危險的,難免讓大資料變成“大忽悠”。比如,國外一家企業發明的通過媒體、電商資料預測一個城市發生流感的大資料技術,近來就被科學家發現存在過分高估的情況,其原因正在于分析模型的偏差與統計科學基礎的缺失。是以,真僞性判定仍然是我們面臨的一個大挑戰。

科學應對這些挑戰,需要大智慧。目前從政府層面看,應着力抓好以下5個方面:

抓宏觀規劃與政策引導。國家大資料戰略讓我們明确了發展與運用大資料是國家意志,是實施創新驅動發展戰略的重大舉措之一。這個戰略應由一系列的規劃、政策、布局等構成。國家應在戰略上特别是在促進資料資源開放和共享、重點行業先行、産業轉型更新等方面統籌規劃、出台政策、紮實推進。

抓資料資源管理與國家資料資源庫建設。在“人人都産生并希望擁有資料、人人都希望從資料中獲益”的大背景下,必須強化資料是國家資源的意識,重視建立國家資料資源庫。這樣的建設,首先應作為一項國家工程,統一規劃;其次應切實解決分級、分層、分行業建設與管理體制問題。目前,應特别注意大資料資源意識所誘發的行業資料保護以及資料資源流失與濫用問題,切實将大資料資源用于服務人民、服務國家建設。

抓行業引領與重點示範工程。實施國家大資料戰略,可從抓重點行業、重點工程入手。一些行業如電力、交通、金融服務、網際網路、制造業等,對國家經濟發展影響巨大,資料積累豐富,并且有專屬性、共享相對容易等特點。率先推動這些行業運用大資料加快發展,有重要的帶動性和示範性。另外,作為整體布局,在國家層面推動一批大資料應用工程也是重要和必要的。例如,推進稅務、财政、投資監管等大資料應用工程,都可能産生意想不到的效果。

 

抓共性基礎與核心技術研發。投資大資料、應用大資料已是當下大衆創業、萬衆創新的熱情所在與價值選擇。誰為這樣的大衆熱情負責?誰來保證各行各業大資料應用的健康可持續發展?這無疑是國家責任。擔負這一責任,最重要的就是推動大資料科學基礎的夯實和大資料關鍵技術的研發。我們不能再走“拿來主義”的老路,不能沒有規劃而任其自由發展。國家應組織力量,下大力氣解決大資料應用的共性基礎和關鍵技術突破。

抓大資料人才隊伍培養。推動大資料産業發展,提升國家大資料運用能力,人才是第一位的。“懂資料、會分析”的複合型人才缺乏是當下國内外面臨的共同困難。在這種情形下,我國應發揮體制優勢,迅速動員各高校、研究機構快速設立一批适應各層次需求的大資料人才培養項目,加快形成支撐國家大資料戰略實施的強大科學研究與應用人才隊伍。

原文釋出時間為:2016-03-16

本文來自雲栖社群合作夥伴“大資料文摘”,了解相關資訊可以關注“bigdatadigest”微信公衆号

繼續閱讀