天天看點

帶你讀《資料自治》第一章緒論1.3大資料(二)

1.3.3         資料産業

随着技術的進步和網際網路的普及應用,不論政府、組織、企業,還是個人,都越來越有能力獲得各種各樣的資料。這些資料類型多樣、來源多樣,甚至超過了早期大型企業積累的資料,形成了各種各樣的資料資源。在這種情況下,對資料資源的開發利用就變成一個社會需求,并形成一個新興戰略産業——資料産業。

資料産業的産業鍊主要包括:從網絡空間擷取資料并進行整合、加工和生産,資料産品傳播、流通和交易,相關的法律和其他咨詢服務。資料産業包括資料資源建設與流通、資料技術開發與銷售、資料産品與服務 3個主要方面,具備第一産業的資源性、第二産業的加工性和第三産業的服務性,是新興戰略性産業[11,13]。在大資料時代,任何經濟形式都需要大資料的支援,大資料在創造新産業的同時,也在促進傳統産業的轉型更新。圖 1-2展示了資料産業的内涵[11]。

帶你讀《資料自治》第一章緒論1.3大資料(二)

圖 1-2資料産業

資料産業模式[11]是指“收集資料、分析資料、提供服務”的商業模式。早期的資料服務模式并不涉及資料分析,例如早期的 Google搜尋服務、SCI論文引文服務、門戶網站。現在的資料産業模式增加了“分析資料”的工作,挖掘了資料包含的價

值,實作了對資料資源的開發利用。通過“分析資料”得到的價值應用廣泛,例如,分析電子商務資料可以預測經濟狀況、地區消費水準和消費習慣等。

資料領域中最重要的工作是收集、積累資料資源,使得資料資源在解決實際問題時“夠用、可用、好用”。由于“資料引力效應”已經形成,“用服務換資料”已經成為一種主流的商業模式。“資料引力效應”是指資料領域存在的“資料越多,服務越好;服務越好,資料越多”這樣一種資料越來越集中的現象。“資料引力效應”正在創造大量的新型資料産業模式,移動網際網路使得資料服務無處不在、無時不在,将推動資料産業快速發展。

1.3.4         資料生态

資料生态是指圍繞資料開展的科學研究、技術開發和産業應用,按照“科學推進技術進步、技術創新應用、應用提出問題”這樣的循環持續發展的一個生态圈(如圖 1-3所示)[11]。

帶你讀《資料自治》第一章緒論1.3大資料(二)

圖 1-3   資料生态

在資料生态中,有以下幾個現象需要重視。

•  用資料研究科學,科學地研究資料。用資料研究科學是指科學研究已經進入資料密集型科研範式,即第四範式;科學地研究資料則是指要将研究資料作為一種科學,即資料科學。

•  技術進步促進資料增長,資料增長要求技術進步。長期以來,資訊技術發展、資訊化建設的具體展現是“技術進步促進資料增長”,例如,智能手機出現後,人們可以随時拍照、視訊通話,資料增長速度就加快了;而大資料則展現的是“資料增長要求技術進步”,即現有的技術不能處理飛速增長的大資料集,需要開發新的技術,例如,現有的聚類分析算法不能分析 EB級别規模的資料集;又如,以前的資料分析算法主要針對同質資料進行分析,現在可能需要對異質網絡進行分析。

•  資料越多,服務越好;服務越好,資料越多。這個現象将導緻資料越來越集中,我們稱其為“資料引力效應”。這将産生新的壟斷——資料壟斷。

繼續閱讀