天天看點

以我為主,為我所用:國際市場的資料開放經驗值得借鑒嗎?

作者:燕梳文化

編者薦語:

數字經濟時代,資料是重要的生産要素。為了應對數字時代的競争,各國都紛紛出台資料開放相關政策和法案。國際市場的資料開放經驗是否值得借鑒?企業在這其中應該扮演怎樣的角色?

資料開放,是數字經濟和企業數字化轉型的必然要求

生産要素是經濟發展的核心“燃料”,并且,不同的經濟類型各類生産要素的重要性不同。農業社會,土地和勞動力是最重要的生産要素;工業社會,除了土地和勞動力外,資本和技術要素占據核心的位置;而進入資訊社會,尤其是數字經濟時代,資料作為一種新的生産要素,其重要性與日俱增。

以我為主,為我所用:國際市場的資料開放經驗值得借鑒嗎?

中國數字經濟規模與占比 資料來源:中國信通院 資料猿整理

如果将社會經濟看作一個人的身體,那麼生産要素就是流動在身體裡的血液,為全身的細胞帶去所需物質和能量。跟血液一樣,生産要素的一個關鍵特征就是流動。同樣的,資料作為一種新的生産要素,也需要充分流動,才能有效發揮作用。

數字經濟分為數字産業化和産業數字化兩個部分,其中,産業數字化即實作制造、金融、醫療、交通、農業等行業的數字化。傳統行業的數字化更新,核心在于釋放資料價值。首先要解決資料有無問題,然後要推動資料在各行各業的有序流動。

以我為主,為我所用:國際市場的資料開放經驗值得借鑒嗎?

數字産業化與産業數字化規模 資料來源:中國信通院 資料猿整理

宏觀層面,資料開放共享,是推動數字經濟、産業數字化發展的關鍵動力。微觀層面,資料開放共享,則是實作産業鍊上下遊企業協同的重要基礎。

企業就像是社會經濟的組成細胞,社會經濟的數字化,本質上就是一個個企業的數字化。企業的數字化轉型,一方面需要數字化技術能力,另一方面也需要外部資料“輸血”。

強化公共資料開放、激活市場活力,是歐美的重要經驗

既然資料開放共享如此重要,那麼該如何推進呢?它山之石可以攻玉,歐美國家在這方面走在國際前沿,探索出不少值得借鑒的經驗,具體來看:

建構資料開放法律、政策體系,設定專門的機構推進政策落地。

資料開放是一個系統工程,需要合理的頂層設計,配套完善的法律法規和政策體系,讓資料開放有序推進、有章可循。

歐美國家在資料開放共享的政策法規制定方面,走在全球前列。以美國為例,美國建立起從聯邦政府、各政府部門,到各州的資料開放政策。在聯邦政府層面,美國出台了《政府資訊公開和機器可讀行政指令》、《美國資料開放行動計劃》、《透明和開放政府備忘錄》、《資訊自由法案備忘錄》等綱領性檔案,以及《開放政府指令》、《使開放和可機讀成為政府資料預設狀态的總統行政指令》、《提高對聯邦資助的科學研究成果開放的備忘錄》、《開放資料政策》等具體管理辦法;司法部頒布了《資訊自由法案》《資訊自由法案指引》;美國的各個州也頒布了相關的資料開放政策,特拉華州、紐約州、賓夕法尼亞州、羅德島州四個州的州長釋出了開放資料行政指令,阿肯色州、科羅拉多州等16個州有明确的法律要求行政部門開放資料。

除了政策法規體系,還需要有專門的組織機構來保障這些政策真正落到實地,而不是一紙空文。比如,美國為了推動資料開放專門設立了首席資料官(CDO),指導所有行政分支機構使用和管理資料。除了聯邦政府外,美國目前有25個州和哥倫比亞特區擁有CDO或類似職位。英國成立了專門的資料戰略委員會,推動資料開放。此外,英國還建立了許多專門機構來負責處理不同的事務,如建立開放資料研究所負責開放資料的推廣、研究和利用;資料戰略委員會為政府提供有關資料開放的建議,推動開放資料研究,推廣最佳實踐案例等;公共資料小組負責資料政策的制定,重要資料集的采集、管理和分發等。

加強資料開放平台建設,不斷豐富資料集,提升平台易用性。

資料開放需要一個面向公衆的平台載體,歐美國家大多有政府資料開放網站,比如美國的http://Data.gov,歐盟的https://data.europa.eu/en,英國的http://Data.gov.uk等。

以美國的政府資料開放網站為例,企業可以從網站上免費下載下傳資料。目前可以在網站上找到超過30萬個資料集,覆寫醫療健康、能源、氣候、教育、财政、公共安全等廣泛領域。在該網站上,還提供API接口,幫助第三方應用調用開放資料集。

以我為主,為我所用:國際市場的資料開放經驗值得借鑒嗎?

美國政府資料開放網站

歐盟建立了一個統一的資料開放網站,開放了36個國家超過143萬個資料集,覆寫經濟金融、教育文化、政府公共部門、健康、人口與社會、科學技術等領域。

以我為主,為我所用:國際市場的資料開放經驗值得借鑒嗎?

歐盟資料開放網站

評價一個資料開放平台,除了平台上的資料集數量和品質外,還有一個很重要的名額,就是平台的易用性。資料開放的目的是讓企業能很好的應用這些資料,基于資料推進相關業務的開展,釋放資料的價值。

歐美國家在建設資料開放平台的時候,有兩方面的經驗值得借鑒:一方面,建設資料标準體系。統一的資料标準,包括資料的命名、定義、結構和取值範圍等方面有統一的規則和基準,提升不同資料系統之間的互操作性,是資料開放共享的基礎;另一方面,通過開放API等方式,持續優化平台的易用性,降低平台使用門檻,確定資料可以便捷查找和調取,讓開放的資料集真的能夠應用起來。

加強政府機構與市場主體的合作,釋放資料價值。

值得指出的是,政府是資料開放的協同者,而企業作為市場主體,無論是從資料提供還是資料應用層面,都是關鍵的參與方。能否調動企業的積極性,在很大程度上決定了一個國家資料開放事業的成敗。一個優秀的企業,對社會的資料開放大有裨益。

以英國的勵訊集團為例,該公司是一家為客戶提供基于資訊的分析和決策工具的全球供應商,為180多個國家的客戶提供服務,有超過33,000名員工。

在海量專業資料的治理方面,勵訊集團旗下科研醫學資訊分析公司愛思唯爾組織審查、編輯和傳播全球約18%的科學文章;愛思唯爾的ScienceDirect擁有來自4,400多種期刊和43,000多種電子書的1900萬篇内容,每月獨立通路者超過1800萬;愛思唯爾的免費新型冠狀病毒資訊中心在2021年的下載下傳量超過1.75億次。勵訊集團積累了大量的科研和醫學資料,其具備的海量專業資料的治理經驗,無論是對各國政府還是全球企業而言,都有重要的價值。

在資料應用方面,勵訊集團旗下的大資料分析公司律商聯訊風險資訊(以下簡稱“律商風險”),自2000年開始一直與美國國家失蹤與被剝削兒童中心(NCMEC)合作,推進ADAM(自動發送失蹤兒童警報)項目。在ADAM的資料庫中約有180萬(2016年資料)注冊收件人,律商風險為ADAM項目提供技術支援,包括重新設計該平台,完善平台功能,優化使用者界面,提供可以使警報更好地定向傳達至特定區域的新映射技術等。ADAM的資料,加上律商風險的技術,可以讓失蹤兒童警報資訊在短時間内迅速發送到美國特定地理搜尋區域内的執法部門、醫院、圖書館和企業。目前,ADAM已經尋回了近200名失蹤兒童。

以我為主,為我所用:國際市場的資料開放經驗值得借鑒嗎?

資料開放的目的,是為了讓資料能夠用起來,這需要具備很強的大資料、AI等資料智能技術和服務能力。政府機構與企業合作,共建開放資料集,并借助大資料、AI技術,有效挖掘資料價值,推動相關行業應用和産業更新,是歐美推動資料開放方面非常重要的一條經驗。

以汽車行業為例,在全球碳中和汽車技術變革雙重驅動下,全球新能源車銷量快速增長,滲透率持續提高。2021年,全球新能源車銷量達670萬輛,同比增長106.8%,2012-2021年CAGR(Compound Annual Growth Rate,複合年均增長率)達55.6%。

以我為主,為我所用:國際市場的資料開放經驗值得借鑒嗎?

全球新能源車銷量情況(萬量) 資料來源:EVSales,EVTank

在看到新能源産業快速成長的同時,也需要解決産業變革帶來的一些新問題。例如,以往的車險理賠标準都是建立在傳統燃油車基礎上,燃油車和新能源車由于動力系統、重要部件、電控系統等方面存在巨大差異。如果将原有車險承保方案直接套用在新能源車上,會出現問題,比如基于燃油車曆史理賠資料搭建的定價模型無法精準預估新能源車賠付風險,導緻出險率與賠付率居高不下。為此,需要基于新能源車特點量身打造新的車險承保方案。以律商風險提供的新能源車險解決方案為例,借助資料整合和大資料分析技術,科學地組合車輛共性的靜态資料(一輛車的實體參數,即它的長寬高、顔色等)、新能源車特有的靜态資料(電池類型、電機功率)、以及新能源車動态資料(因為車輛在不同時間段使用所帶來的風險差異資料),從“動”和“靜”兩個次元精準量化評估新能源車的從車和從用賠付風險。針對保險公司現有的定價模型所産生的預測誤差,律商風險用新能源車風險評分系統對定價模型的預測結果進行修複和優化,可将定價模型的預測精準度提升50%以上。

根據中汽協資料,2022年1-8月,大陸新能源車生産/銷售397/386萬輛,同比+119.0%/ +114.6%,1-8月累計滲透率為22.9%。其中,8月新能源汽車滲透率27.9%,同比+10.1pcts,環比+3.4pcts。可以說,大陸汽車産業正處于“換擋”的關鍵時期,新能源車正實作對傳統燃油車的加速替代。中國也亟需通過資料開放共享和資料創新應用,來實作汽車産業更新。

資料開放共享,對于推動相關産業發展有重要作用。以歐美的經驗來看,政府和企業應該攜手共建各個領域的資料集,企業再基于這些資料集來進行應用開發和模型訓練,然後通過商業應用來推動相關産業的繁榮。

中國的資料開放,任重而道遠

分析歐美的資料開放情況,是為了更好推動中國的資料開放事業。與全球領先水準相比,大陸的資料開放還處于早期階段,存在諸多不足。具體來看,主要表現在以下兩個方面:

政策體系不夠完善,資料開放力度有待加強。

中國目前還沒有建立完善的資料開放共享的法律法規和政策體系,法律建設滞後。資料安全和使用者隐私保護,成為目前政府和群眾的關注重點,相關法律法規陸續出台。需要指出的是,資料開放共享是創新應用的重要基礎。政府和企業都需要做到資料開放和資料保護的平衡,不能盲目的追求絕對的資料安全,而放棄開放共享,這會成為數字經濟發展和企業數字化轉型的阻礙。我們需要建立完備的法律法規體系,妥善處理資料安全與資料開放共享之間的關系。

在資料開放平台建設方面,大陸目前主要是各個地方政府推出資料開放平台,還沒有全國性的政府資料開放平台。而且,各個地方政府資料開放平台,普遍存在資料集數量和品質不足、中繼資料标準不統一、平台易用性差等問題。

政府需要進一步加大資料開放的力度,從政策法律體系、組織保障、标準制定、平台建設等方面着手,提升資料開放水準。2013年6月,八國集團首腦在北愛爾蘭峰會上簽署的《開放資料憲章》确立了資料開放六個原則,有一定的參考價值:第一,預設開放。這在不侵犯公民隐私的前提下,政府資料從被動開放轉變為主動開放。第二,及時和全面。政府應盡可能以原始、未經修改的形式提供即時全面的資料。第三,可擷取和可使用。不僅要免費提供資料,還要確定查找和機讀的便捷性,并在檔案格式等方面提升使用者體驗。第四,可比較和可互操作。采用統一的資料标準提供高品質資料集,更有利于挖掘資料價值。第五,改善政府治理和擴大公民參與。第六,包容性發展和創新。

企業的資料開放意願不足,資料價值沒能得到有效利用。

上面提到過,企業作為市場主體,在資料開放共享中扮演關鍵的角色。來自金融、網際網路、電信、制造、醫療等各個領域的企業開放共享資料集,并基于共享資料集,探索自身業務應用場景,才能實作資料開放和應用的正回報循環。

目前來看,大陸的企業在資料開放領域,總體上處于缺位的狀态。企業共享資料的意願不足,都想别人向自己開放資料,但自身并不想開放資料。誠然,企業對資料開放秉持謹慎态度,是出于保障資料安全的考慮,但更重要的是企業将資料視為其重要的資産,不願意輕易分享,還有就是企業看不到“資産變現”的價值,而這個問題的解決,或許可以通過培育買方來解決。殊不知,資料作為一種生産要素,流動性是其天然的要求,流動的資料才更有價值。

如果隻是一座座資料孤島,将嚴重阻礙資料價值的釋放。以醫療AI為例,目前國内醫療AI企業的業務模式是:假如要研發針對乳腺篩查的AI産品,就找國内幾家醫院以聯合科研或業務合作的方式,拿到這幾家醫院的乳腺資料集,基于這些資料來訓練AI模型。由于中國各個醫院的醫療裝置供應商、型号多樣化,不同醫院的資料标準并不統一,導緻用A醫院訓練的模型,用到B醫院時模型的準确率就大打折扣。可以說,要推動醫療AI的發展,醫療資料的開放共享是必不可少的前提條件。在諸多病種當中,肺結節AI篩查最為成熟,一個關鍵原因,就是因為肺結節資料集最為豐富。

綜上,資料開放共享無論是從宏觀數字經濟的發展,還是微觀企業的數字化轉型更新,都有重要的意義。然而,大陸的資料開放程度不足,與産業數字化創新程序不比對,阻礙了資料價值的釋放。在資料開放共享方面,歐美國家走在全球前列,有一些值得借鑒的經驗,比如政府加強相關法律法規體系和開放平台建設,企業作為市場主體深度參與資料開放共享程序,共建資料開放标準,有效利用開放資料集開發應用,結合具體業務場景釋放資料價值等。大陸的資料開放,還有很長的路需要走。路雖遠,行則将至;事雖難,做則必成。

文:月滿西樓 / 資料猿

END