天天看點

大資料痛點 |《财經》封面報道

大資料痛點 |《财經》封面報道

在政府和市場的雙重催動下,那些原本封存在伺服器裡的陳年資料,成為一座座蘊藏豐富的“金礦”。然而,能真正做深度挖掘的企業并不多,這一領域正在等待着“殺手級”應用的出現

3月5日,國務院總理李克強在十二屆全國人大四次會議上作2016年政府工作報告時提到,目前中國發展正處于這樣一個關鍵時期,必須培育壯大新動能,加快發展新經濟。

這是政府工作報告中首次出現“新經濟”概念。報告進一步說明,要推動新技術、新産業、新業态加快成長。其中,在“十三五”時期主要目标任務和重大舉措中,李克強提出,促進大資料、雲計算、物聯網廣泛應用。

去年9月國務院印發《促進大資料發展行動綱要》稱,國家政府資料統一開放平台将在2018年底前建成,率先在氣象、環境、信用、交通、醫療、衛生等20餘項重要領域,實作公共資料資源合理适度向社會開放。今年的政府工作報告亦指出,加強政府自身建設,提高施政能力和服務水準。重任千鈞惟擔當。

不僅中國,大資料被各國政府都提到了前所未有的高度,公共資料開放也紛紛提上日程。

在政府和市場的雙重催動下,那些原本封存在伺服器裡的陳年資料,成為一座座蘊藏豐富的“金礦”,興奮的企業和研究人員一邊着手搜尋資料,一邊将有價值資料按需篩選出來重構。然而,能真正做深度挖掘的企業并不多,這一領域正在等待着“殺手級”應用的出現,助推金融、醫療健康、零售業、制造業等各行業産生根本性的變革。

——編者按

國務院總理李克強在作2016年政府工作報告時提到,促進大資料、雲計算、物聯網廣泛應用。其實自去年“兩會”起關注大資料的提案就不少,今年“兩會”的代表和委員們又開始送出新一輪為大資料鼓勁的提案。

全國政協委員劉慧、榮建勳、劉漢元等分别建議,建構大資料平台,遏制網際網路金融亂象、發展科技保險、讓農業更有規劃。全國人大代表邵志清則提出議案,呼籲制定“大資料法”,規範政務資料的共享開放和市場資料的交易流通。

廣東人大常委會已經建立了一個代表履職支撐平台,運用大資料為代表履職提供支撐。人大代表可通過“人大百科、履職資訊定制、議案建議、履職活動、履職溝通交流、聯系群衆輔助”等六個前台服務子系統,擷取和釋出資訊。

你,每一秒都可能産生或者使用一個不起眼的資料:打車的路線、網上的交易、計步的app、去醫院挂号、一張交通罰單、一次飯局等,這些痕迹都被有心的公司收集起來,再通過計算、重構,變成一個得心應手的應用,出售給你,或者讓你免費使用,同時提供新的資料作為回饋。

大資料不僅是一種海量的資料狀态和相應的資料處理技術,也是一種思維方式、一項重要的基礎設施。2011年以來,大資料概念在中國火熱,傳道者和求學者湧現,穿梭于衆多的大資料會議和論壇,以創新為己任的科技公司,都在踅摸着跟大資料産生關聯。

在剛剛結束的人機圍棋巅峰對決中,谷歌人工智能圍棋程式alphago以4:1擊敗了人類選手李世石。人工智能界一片歡呼,這是深度學習+大資料的勝利。細想大資料被行業關注已5年了,實際能投入實用的大資料應用并不多,讓人驚歎的“殺手級”的應用更是寥寥,反倒是深度學習,通過與大資料的結合,獲得迅速發展。

國内大資料領域的一些學者和業界人士抱怨:政府所掌握的公共大資料存在重重壁壘,難以共享,從源頭上有礙于創新。這一觀點有其合理之處,但并不全面。因為它難以解釋,為何已經手握海量資料的bat(百度、阿裡巴巴和騰訊)等國内網際網路巨頭,也尚未用大資料技術挖掘出扛鼎之作。

  

事實上,這個令人興奮的新事物,仍處于摸索研究階段,大資料産業有必要重新審視自身的痛點,尋找解決之道。

◈實戰低于預期

在高德資訊技術有限公司(下稱高德)北京辦公室裡,星羅棋布的辦公桌間豎立着一面led顯示屏,上面是密密麻麻的紅點與曲線。

一名技術人員標明了城市與時間參數,并選取長安街上一段長約300米的路段,螢幕上立即顯示出該路段實時通過的車輛,這些車輛的實時位置一目了然,系統還給出未來幾分鐘,甚至幾個小時内的車流量預判。

這是高德智能出行業務的一部分,也是大資料應用的一個實景。大資料,或稱巨量資料,不僅描述了大量的資料,還涵蓋了處理資料的速度。

大資料應用已帶來可見的果實。高德公司估算,使用高德地圖躲避擁堵功能,平均每月為全部使用者節省時間達700年,節油高達1840萬升、價值1.3億元。

谷歌的alphago也是一個突出的例子。一般來說,大資料的應用場景是通過大資料分析獲得洞察,并基于這些洞察進行預測,根據預測結果做出行動。而深度學習擅長傳統大資料分析中難以使用的語音、圖像等,它可以教授計算機逐級往下處理資料,并能根據不同層級的資料做出修正,思考過程逐漸從簡單到複雜。這種接近人腦的學習方式,可以通過訓練之後自行掌握概念,而且輸出結果會随着資料處理量的增大而更加準确。包括谷歌、ibm、微軟、facebook等在内的科技巨頭,在深度學習和大資料結合方面的投入越來越高。

雖然資料還沒有被列入企業的資産負債表,但大資料領袖、牛津大學教授維克托·舍恩伯格預測,這隻是時間問題。資料資源将和土地、勞動力、資本等生産要素一樣,成為政府管理與企業盈利的戰略資源。

精準營銷、醫療和金融這三大領域,目前被視為大資料最具前景的應用領域。在大資料概念提出前,大型電商、醫療行業和金融企業,基本應用随機抽樣分析。理論上,大資料分析的結果更精準,因為它将原來的小樣本變成全樣本。按維克托·舍恩伯格的說法,所謂大資料分析方法,就是不用抽樣調查這樣的捷徑,而采用所有資料的分析方法。

在分析自家電子商務平台的客戶信用及行為資料後,阿裡巴巴創生了螞蟻小貸、花呗、借呗等産品;騰訊資料,則充分、完整記錄了人們在網際網路上的行為軌迹和社會屬性,可以從中挖掘、分辨出使用者的行為模式、興趣偏好等;由于搜尋功能的精準性,百度掌握了更多使用者的真實需求。

全球在大資料研究的投入已不少,2016年會更多。美國資訊技術研究和分析公司gartner預測,2016年全球在大資料方面的總花費将達到2320億美元。

這一龐大的投入與實際産出,目前并不比對。現有的資料搜集和處理能力,常使電商看上去很不着調,當客戶從一個電商平台購買一部手機後,下次再登入時,電商可能簡單粗暴地又推送手機廣告;微信朋友圈的廣告推送,一直是網民取笑的槽點。

很多企業還是堅持用傳統的随機抽樣方法,這樣可以較低的成本、較少的資料,進行一定精确度的分析,比大資料分析要經濟實惠。

聚合資料雲計算事業部總監商渭清在一次業内論壇上表示,線上廣告投放,一般命中率是1.0%,做得好的能到1.3%。精準營銷的命中率,應該在3%或5%以上。

美國加州大學伯克利分校計算機科學和統計系教授邁克·喬丹(michael jordan)認為,目前的大資料給出的結果可靠性太低,如果急于應用到實際中,就好比是土木工程還沒學好就開始造橋,結果可想而知。

窘境源自技術層面的缺失。一是業界對于大資料分析的價值邏輯缺乏足夠深刻的洞察,以緻搭建的模型偏差較大;二是大資料分析中的某些重大要件或技術還不成熟。

美國對醫療大資料情有獨鐘,基礎建設整得不錯,相關研究開展也早,但是,“要形成好的應用效果,美國估計還要等5年至10年”。清華大學統計學研究中心主任、哈佛大學統計系教授劉軍對《财經》記者分析。

盡管在過去的五年裡,全球大資料計算性能實作了超過20倍的增長,100tb資料排序時間由8274秒縮短到377秒。而實際上,很多業内人士對大資料,仍缺乏深刻的認識。

資訊技術研究和分析公司gartner在2013年做的一項調查顯示,64%的企業表示正在投資或計劃投資大資料。然而,當問及企業面臨的“大資料的挑戰”時,約56%的企業聲稱是“确定如何從大資料獲得價值”,41%是要“定義我們的大資料戰略”,另有23%的企業是為了“了解什麼是大資料”。

美國杜克大學行為經濟學教授丹·艾瑞裡(dan ariely)曾将大資料技術比作未成年人的性行為,“每個人都談論它,但沒人知道怎麼做,每個人都以為其他人在做,是以每個人都宣稱他們在做。”

科大訊飛股份有限公司(下稱科大訊飛,002230.sz)進階副總裁陳濤告訴《财經》記者,熱炒大資料的背後,有it行業在推動,為了出售伺服器、存儲、服務,過分渲染了大資料使用的急迫性。

◈誰握大資料

當把不同來源、不同次元的資料關聯在一起,交叉挖掘分析,就有可能發生“化學反應”,大資料因共享而增值。

高德的交通資料來源主要有兩個,一是衆包資料,5億高德使用者在使用交通導航服務時,既是資訊使用者,又是資訊的分享者。高德副總裁、首席交通資料分析師董振甯告訴《财經》記者,“通過衆包,每月從使用者那裡收到超過60億公裡檢測(資料),高德再用這些完善地圖資料。”

第二個來源,全國幾十萬輛計程車,及幾百萬輛物流車輛的資料,這些資料經交通背景彙總、處理後,可實時計算出路況資訊,回報在使用者終端上。

據美國國際資料集團(idc)的數字世界研究報告顯示,2013年人類産生、複制和消費的資料量達到4.4zb(1zb等于10萬億億位元組)。而到2020年,資料量将增長10倍,達到44zb。

國内除了高德這樣以資料為生的企業,bat通過網民的網購、理财、搜尋,以及社交網絡等,也坐擁海量資料。百度大資料,基于使用者在百度上的所有行為、檢索詞;騰訊掌握了海量的社交資料;阿裡巴巴擁有使用者的交易資料。此外,一批提供資料權益服務的資料公司也應運而生。

這些資料公司利用爬蟲技術,抓取海量網頁上的資料,按類将這些資料進行整合梳理,再接入許多第三方資料。“像火車票購買資料和房屋買賣資料,資料量不大,但是價值很高。”sensors data的創始人兼ceo桑文鋒告訴《财經》記者,幾大電信營運商也掌握了較多的使用者資料。

在移動互聯時代,由于每台終端裝置都“綁定”一個使用者,一旦将資料分享,合作者也就長期擁有了這些使用者,這導緻整個業界的心态放不開,害怕使用者流失。

其實,不像煤炭、石油等資源,用過之後不可再生,因而很難實作共享,資料資源可以重複使用,在共享中不斷産生新的價值。

為獲得更多資源,企業之間打破慣有忌諱,正在形成合作氛圍,一個個資料生态圈逐漸生長。

阿裡巴巴資料事業部産品經理王峰認為,單純的資料交易和資料加工服務“很粗魯”。1月20日,阿裡雲宣布開放其大資料能力,釋出全球首個一站式大資料平台“數加”,如有資料開發能力的團隊可入駐“數加”,借助上面的工具為各行各業提供資料服務。這是一個“普惠大資料”,即讓全球任何一個企業、個人都能用上大資料。

王峰表示,“數加”盡管不是免費的,但是能夠幫合作夥伴把蛋糕做大,賺到更多錢。

即便是bat,也“觊觎”着一個重量級的資料擁有者——各級政府。多年來,各級政府通過行政手段和公共管理過程,依法擷取了海量資料。絕大多數中央部委、省級政府部門的核心業務都有資料庫支撐。如公安部有一個覆寫13億人口的人口資料庫,國家工商總局有企業法人資料庫,金融、醫療、稅務、質檢、社保、教育等都有各自的資訊庫。

在陳濤看來,政府所擁有的公共資料,是盤活大資料資源的坐标系,這些資源是一個社會的基本資訊,是核心資料。

大資料痛點 |《财經》封面報道

◈公共資料圍牆

政府部門不會輕易放開掌握的資料。

一位中外合資農業公司的市場總監就曾碰過釘子。他數次聯系國家氣象局,希望拿到一些農業大省曆年的氣象資料和實時的觀測資料。通過資料分析,這家公司可以篩選出最适合當地的種子,進一步開發出手機app,即時給農民推送農時建議。

全國政協委員、通威集團董事局主席劉漢元在今年“兩會”的提案中提到,建設農業大資料平台,可以提前預測農業産量,使農業的生産更具計劃性。類似的農業大資料服務,美國孟山都公司旗下的climate corporation早已推出。

然而,政府機構由于自身定位和責任機制,缺乏放開公共資料的動力。國家氣象局就婉拒了上述農業公司市場總監的資料合作請求。

氣象資料具有壟斷因素,氣象局如果不肯提供原始裸資料,商業機構是無計可施的。

商業類氣象服務的推廣則需要國家氣象部門授權。

從知識産權保護角度看,隻有原始裸資料,商業機構可以無償抓取利用。如果被抓取的資料是經氣象局二次加工的,那麼這些資料就具有知識産權,因為這時的資料裡面增加了人的智力、勞動成本,是以氣象局向商業機構收費屬于合理行為。

公開報道顯示,天氣服務類軟體墨迹天氣上線之初,是從網上抓取的天氣資料,後來氣象局找上門來要求付費,開價一年幾十萬元。這對初創的墨迹天氣來說,也是一筆大開銷,隻好另想辦法。

一位業内知情研究員介紹稱,氣象局有官員曾在一次論壇上表示,向抓取天氣資料的軟體公司收費,是政府定價行為,屬于有償服務。

即便用于研究,資料也并不易擷取。作為中國科學技術協會副主席,同時在清華大學、北京航空航天大學兼任教授,張勤有豐富的與公共部門項目合作的經驗,他在一次學術會議上抱怨道,“搞大資料的人,卻時常感到沒有資料可用。”

張勤與北京一家醫院合作,運用資料分析眩暈疾病的一些規律。合作醫院從多年積累的病例資料庫中随機篩選出60多個案例。在統計學上看,這點資料量不夠消除“噪音”——資料幹擾因素,很難發現有價值的規律,可合作醫院拒絕提供更多的案例。

張勤的遭遇,也是中國不少研究者和産業界的感受,公共資料資源太封閉。2015年4月,國際著名期刊《自然》刊文稱,中國的研究者現在連擷取普通資訊都越來越困難,比如,機動車保有量的資料。原因是,大多數的公共領域資料都攥在官方機構手裡,其中有些機構正在加強它們的壟斷地位,這使資訊更難以擷取。

同樣出于利益考量,一些政府部門擔心,随着資料的開放,本部門履職的行動自由會受到束縛,原來不透明的部門行為被公開後,可能招緻輿論批評甚至訴訟,因而沒有意願主動開放資料。

上海市市委書記韓正曾表示,目前政府掌握着相對齊全的資料,卻一直存在着縱向和橫向分割的問題,并沒有真正打通和共享。

政府機構擁有公共資料無法适度開放,并不能使資訊增值。挖掘政府大資料價值最好的辦法是,适度允許私營部門和社會公衆通路。例如,香港公共資料開放網站“資料一線通”的口号就是“公共資料,增值利用”。

天津市資訊中心工程師劉葉婷分析,由于在國家層面尚未建構起完善的公共資料開放戰略,是以難以形成從中央到地方的多級公共資料開放體系。

一些地方政府和部門希望把握本地區、本部門的公共資料,進行商業開發,做成轄區内“統一”資料系統。這樣的系統開發,可能在建成後湧現出一個地方性的,或者部門性的資訊壟斷機構。

抛開主觀意願,官方機構能不能拿出高品質的資料資源,也是一個問題。

北京大學中國衛生經濟研究中心主任劉國恩與美國斯坦福大學合作,聚焦于中國醫院的管理水準,研究中要用到醫院位址、電話号碼、有多少床位,以及每年的死亡人數等資料。他以為這些醫院的基本資訊,地方政府和衛生計生部門手裡肯定有,但兩年時間裡,大概隻湊齊了六成資料。

複旦大學數字與移動治理實驗室的研究表明,開放政府資料,首先應在地方層面探索。目前地方政府的資料開放量較低。

科大訊飛2013年與安徽省蕪湖市合作開展社會管理服務項目。拿到地方政府提供的資料資源,科大訊飛的從業人員把資料清洗、比對後發現,很多資料合在一起後對不上,甚至存在沖突。比如,對比民政部門的死亡資料與公安部門的戶籍資料發現,存在幾千人都去世了,還在發終身俸的案例。

陳濤曾感慨,如果不是蕪湖市政府黨委書記與市長堅持,“不交資料、就交帽子”,科大訊飛也很難拿到各部門掌握的資料資源。在與地方政府的合作中他還發現,政府對資料的采樣頻度是比較低的,算不上嚴格意義的大資料。

工業和資訊化部電子資訊産業與資訊化研究所所長李苑建議,政府的很多資料沒有集中管理,還處于資訊孤島狀态,這些都是開放資料需要解決的問題。

◈搭平台立規則

一方面政府部門對所掌握的大資料開發利用,最缺乏的是技術與發掘資料價值的能力,另一方面政府部門自身有越來越強烈的大資料應用需求。是以,如何放開和利用公共資料,需明确規則。

中關村大資料産業聯盟副秘書長陳新河注意到大資料應用會議上的有趣變化,2014年,大家談的都是精準營銷,2015年談的多是傳統行業,現在聚焦于政府、金融和醫療等領域,“政府,是一個最大的應用軟體支付方”。

比如,很多大城市的政府職能部門,都面臨着如何讓城市變得更加智慧這一龐大的課題。

某地虛報了工業産值,但用電量和能耗卻沒有達到相應的規模。這種異常很容易被大資料系統識别出來。發現異常後,相關部門展開複核,可以更有針對性地防止、打擊資料造假。

政府對大資料、雲計算的需求增長,于是,與企業“點對點”的戰略合作協定增多。高德能夠拿到交通部門的資料,是基于與交通部的合作架構,而這種合作又依賴于高德積累了十幾年的導航技術與智能交通的探索,這與政府現在或者未來的政策相契合,能給雙方帶來互惠互利的正回報。

“用移動網際網路的創新思維,搭載大資料技術去改變政府的服務,流動的是資料,人不用再跑來跑去。”陳濤說。科大訊飛在人工智能方面的口碑,為其赢得安徽蕪湖項目的訂單。蕪湖在全國率先以資料交換、共享方式,整合全市政務資源,戶籍、人社、司法、衛計等部門,将統計資料交給市政府,科大訊飛開發軟體,清洗這些資料後,統計彙總成一個個市民從出生到現在的所有證件、公開資訊。

談判、合作、協商、協定,這種政府開發大資料的方式,隻适合針對個别企業的合作。能拿到公共大資料的企業,一類是技術在業内獨具一格,或出身于事業機關、政府部門,另一類就是bat這樣的網際網路巨頭。

雖然這看上去似乎對其他企業不公平,但公共資料先行向這兩類企業試水放行,有其合理之處:一方面這些公司的技術能力或者資源更強,另一方面在大資料隐私保護方面也更可控。董振甯告訴《财經》記者,“(與政府)合作有嚴格的規範制約,什麼該做、什麼不該做,雙方都有約定。”

作為研究者,劉國恩去找地方統計局、醫保局的上司,對方好不容易拿出資料後,都會小心翼翼地再三囑咐千萬不要把資料拿出去。劉國恩也害怕自己一不小心觸碰紅線。他呼籲,一定盡快把法律的紅線劃清楚,“哪怕劃了以後,比以前的空間顯得更窄一點,也要讓業内知道這是紅線”。

開放公共資料,也面臨着洩密風險,這使政府部門也不得不謹小慎微。哪些資料可以公開,哪些資料需要脫敏,如何整合各個地方的資料,地方官員對這些未必清楚。

從這個角度,張勤明白合作醫院的苦衷,“他們不願意把資料拿出來,這涉及到隐私和知識産權兩方面”。最簡單的問題,病曆屬于電子資料,到底屬于誰?法學界還存有很多争議。

因為病曆的著作權屬于醫生,醫生的著作權又屬于醫院的職務行為,是以病曆屬于職務作品,而其中的資料還涉及患者個人隐私,是以,商業機構如果想對醫療資料進行使用開發,就需事先征得醫院、患者等多方面的授權同意。

科技部早已意識到對科學資料共享的立法和政策,并已立項多個研究課題,北京大學法學院教授張平多年來一直承擔其中的課題,她向《财經》記者介紹,政府公共部門在披露公共資料、科學資料等資訊資料時,應該注意避免披露涉及國家安全問題,或涉及個人隐私資訊和商業秘密方面的資料,否則會有法律的風險。

因為使用者隐私資訊、商業秘密等都屬于私權範圍,業内常遵循“誰擁有誰控制”原則。

比如,美國就有“e-government act”,俗稱陽光法、《資訊自由法》《隐私權法》等,對政府掌握的資訊公開的範圍有嚴格的規定。

同時在操作上,歐美國家的合同協定機制也相對完備。比如,去歐美國家大學實驗室做研究員,剛進去時就會被要求簽厚厚一摞合同協定,對所有涉及隐私資料等方面的使用和管理,都會提前約定好,一次性簽完合約。劉軍介紹,在美國,研究者和企業想拿到醫療資料,“要填好多表,過很多關”。

開發使用資料,較好的辦法是通過合同協定機制來約定,規避敏感資料洩露風險,還可以采用資料脫敏技術,即通過技術手段對個人資料資訊去識别化。其中姓名、性别、身高、身份證号碼等都是需要重點進行脫敏處理的資料,尤其在醫療、金融、電信等領域,都包含大量這類資料資訊。

但資料的知識産權問題,還需要法律界的研究。政府與企業合作資料開發項目,政府除了要處理可能涉及的個人隐私資訊資料的洩露問題外,還應處理好怎樣對開發後的資料定價的問題,因為這包括如何補償開發企業的投入成本等。另外,如何避免資料被過度商業性開發利用也值得深思。

“畢竟很多公共資料都是用納稅人的錢采集的,政府不應該以此作為賺錢工具。”一位法律界人士對《财經》記者表示。

在科學資料方面,歐美國家建立了彙交、共享的開放平台和機制,同時還有科學資料的共享法律。中國還沒有統一的資料中心,沒有專門的管理法律,更沒有建立起完備的合同協定機制,這就給個人隐私資料的後續使用、管理留下了隐患。

美國聯邦政府在開放公共資料過程中,采取了階段性逐漸開放政策,根據資料被需求度、涉密度等多個因素的考慮,将資料劃分為立即開放、短期内開放、計劃開放、暫時無法開放四個類别。

業内專家分析稱,每個國家在開放公共資料時,都受國家安全和國家利益驅動,會優先考慮所開放的資料是否會對國家政治、經濟安全造成負面影響,美國也不例外。基于此,美國會将過去20年的公共資料開放,但如果涉及高精尖技術的資料,就不會開放。

北京理工大學網絡法研究所研究員孟兆平認為,中國政府開放公共資料應基于開放式的資料平台,可供各種需求者使用。首先要搭建起資料中心的基本模型,再考慮如何創新與企業合作開發資料的模式,使資料平台能“自我供血”維持營運。

2015年9月,國務院印發的《促進大資料發展行動綱要》稱,政府資料統一開放平台将在2018年底前建成,率先在氣象、環境、信用、交通、醫療、衛生等20餘項重要領域,實作公共資料資源合理适度向社會開放。

“各部委真正去執行綱要内容,最快也要到今年兩會以後,綱要具體變為立法立規則還需要一定時間。”孟兆平說。

這不是一個容易完成的任務。科技部曾做過科學資料彙交的工作,仍無法做到将所有資料整理到統一的資料庫中。現實中,很多資料都散落在承擔不同項目的科研人員手裡,隻能按專業分類,分散在不同的資料中心和職能部門中。張平稱,實際上對于有些公共資料,政府也無法全面掌握。

張平建議,國家應當通過投資和立法,加強對醫院、大學以及國家投資的科研項目産生的資料進行管理。

另外,政府還應采取不歧視政策,鼓勵全社會(包括私人部門)以工本費(不超過資料複制和傳遞過程中産生的費用)的價格使用資料。

迫于2018年資料開放的壓力,國家氣象局直屬企業華風氣象傳媒集團有限責任公司(下稱華風)開始尋找戰略合作者,希望借此來增強自身的資料分析能力,保持在氣象資料應用方面的領先地位。

華風的對手已經隐現。2016年1月20日,阿裡雲宣布與國家氣象局達成合作,向公衆開放氣象服務資料,并共同深挖氣象大資料的商業價值。

此舉讓華風的一位項目負責人頗感意外,此次開放了國内縣級以上站點實況,包含溫度、濕度、風、氣壓、降水量、天氣現象等,都是核心資料。

開放公共資料,意味着資料資源在政府、社會間實作自由流動,這是政府行為的一項重大變革,涉及部門越多、範圍越大,資料開放難度也就越大。

原文釋出時間為:2016-03-21

本文來自雲栖社群合作夥伴“大資料文摘”,了解相關資訊可以關注“bigdatadigest”微信公衆号