天天看點

資料治理:資料開放與共享的現狀與未來

作者:數字化轉型方案Home

本資料來源于網際網路,僅供學習交流使用,版權歸屬出版商或者作者所有。如有侵權,請聯系本頭條号進行删除并先行道歉!

資料治理的核心之一是推動資料有序、安全地流動,以便最大程度地挖掘和釋放資料價值。資料流動則需要推動資料的開放分享,實作資料的“聚”“通”“用”。近10年來,發達國家以政府資料開放共享為核心,普遍進行了卓成有效的資料開放分享實踐,在企業資料開放分享方面也有“開放銀行”等創新探索實踐。大陸雖然還處于資料開放分享的初期階段,但因為數字中國、數字政府等數字戰略的實施,以及數字技術在各個領域的持續創新應用,資料開放共享也已取得較好成果。資料的開放分享,核心在于“資料價值”的流通,“分布式資料價值分享”或将成為未來資料開放分享的重要特征,而隐私計算等新型數字技術将為此提供技術支撐。

一 全球資料開放分享的背景

首先,社會對知情權的追求在大資料時代有了新發展。伴随着社會和居民對知情權的追求不斷更新,發達國家在資訊公開、政務公開等方面也一直在更新。從整體來看,美國、英國、德國、法國、加拿大、澳洲等主要西方發達國家,早在20世紀60-80年代就開始出台關于資訊自由、資料保護等方面的國家層級的法律,并不斷改進資訊公開、政府公開的方法。進入21世紀後,數字經濟逐漸成形,資訊革命無論是在政府還是經濟各個領域都快速展開,大資料以幾何級速度增加,傳統的資訊公開、政務公開方式已難以全面、有效達成社會知情權的實作。公衆和各國政府普遍認識到,大資料的開放分享,可以有效打破“資料孤島”,進一步滿足社會和公衆的知情權。

其次,大資料已成為社會發展的重要資源和新型生産要素,隻有推動資料有序、安全地流動,才能更好發揮其價值。大資料普遍被認為具有規模海量、低價值密度、次元多樣等特點,分散的資料次元少、資料量小、價值低。例如,人們的醫療資料分散在不同醫療機構,保險資料分散在不同的保險公司,借貸資料則分散在不同的銀行,進而形成互不相連的單一資料源。單一資料源造成資料規模量小、可供分析次元少、資料品質低等問題,難以通過進階統計分析以及人工智能等技術盤活海量資料資源,充分發揮資料價值。隻有通過算法、算力等實作資料的“聚”“通”“用”,才能實作資料價值的整合和有效釋放。

資料開放分享是人類在數字經濟時代必須面對的時代新命題,一方面資料融合可以帶來極大的社會價值,大資料作為新型資源生産要素可以創造更多的消費者福利,催生更多的經濟創新;另方面,資料開放分享稍有不慎也可能帶來不利影響,在消費者層面可能使個人資料安全和隐私保護受到挑戰,在企業資料主體層面可能使商業秘密、創新動力等受到挑戰,在國家層面可能使國家安全受到部分挑戰。

二 國外資料開放分享的發展情況

繼美國于2009年釋出并上線整合聯邦政府各行政部門資料的政府資料開放平台 Data.gov 以來,資料開放分享在全球範圍内出現快速推進的趨勢。

一、發達國家政府資料開放進展

1995年,美國共和黨衆議院建立THOMAS.gov網站,為公衆提供有關立法的全面資訊。之後,美國出現了多個資料共享網站,讓資料開始走出政府,包括國民人口及經濟資料共享網站 Census.gov、競選财政資料共享網站 OpenSecrets. org、國會相關資料共享網站CowTrack.us 等。2009年,美國國家級政府資料開放平台 Data. gov 正式建立,其整合了聯邦政府各行政部門資料,被學者認為是全球政府資料開放的标志性開端事件。①美國政府資料開放有以下幾個特征:

一是確定資料開放共享平台的資料可利用性較強。首先是資料可操作性強。Data. gov 上有50多個組織的近20萬個資料集,涉及農業、商業、教育、海洋、公共安全等10多個主題,但其有豐富的資料格式,可以滿足不同使用者提取、使用資料的需求,使用者還可以通過該平台獲得資料分析、摘錄、提取、格式轉換等資料處理工具與應用程式。其次是檢索功能強。Data.gov 為使用者提供了直接檢索按分類檢索和按位置檢索三種檢索方式,能夠最大化地友善使用者檢索。最後是使用者參與度高。Data.gov 提供了資訊分享功能,使用者可将部分政府資料分享到Youtube、Flickr 和Facebook 等社交媒體上。為了友善與使用者的溝通交流,Data gov設定了“問詢”“請求”和“問題報告”三大闆塊以提高使用者的參與度。

二是通過完善的法律體系保障資料自由開放。該法律體系用于保證政府資料的開放性以及公衆所獲得資料的品質和數量。從前期的《陽光下的政府法》和《電子政務法》,到2009年奧巴馬簽署的《透明與開放的政府備忘錄》,共同為政府資料開放打好了基礎。2015年,美國頒布《第三份開放政府國家行動計劃》,2016年,美國釋出《聯邦大資料研究與開發戰略計劃》,2018年12月21日,美國啟用《公共、公開、電子與必要性政府資料法案》(又稱《開放政府資料法案》),這些讓美國政府在資料開放方面再上新高度。三是通過有效的執行機制和管理體系確定資料開放落實。

①美國政府為了保障資料開放分享的政策落到實處,制定了配套的政策執行機制,在人力、政府資訊化頂層設計、技術政策制定、技術專項預算管理、資料戰略規劃等多個方面為美國政府資料的共享開放提供支援。在以往基礎上,最新的《聯邦資料戰略與2020年行動計劃》指出,建立聯邦首席資料官委員會和聯邦資料政策委員會,并通過專門負責人完成對資料全生命周期的監控和管理。

英國也是政府資料開放共享程度較高的國家之一。根據2018年網際網路基金會的《開放資料晴雨表》,英國的政府資料開放總得分位列全球第一。

英國的資料開放分享,在平台建設方面注重使用者體驗以及激發社會使用興趣。第一,資料開放提供多種資料分類入口。截至2020年6月,英國政府資料開放平台 data.gov.uk共涉及商業與經濟、環境、地圖、犯罪與司法等12個主題的54000餘個資料集,主要包括國土、地理資訊、人口普查、國家預算、公司注冊、國家立法、國際貿易、健康、教育、犯罪、環境、競選結果等資料。為便于使用者檢索資料,平台提供釋出機構、主題、資料格式等多種分類次元,在支援關鍵詞檢索基礎上,還支援使用者利用布爾邏輯組配、短語檢索、字段限制、基于地理位置檢索等檢索技巧。第二,平台至今已舉行七次“資料開放營”,培養全社會對開放資料的使用興趣。此外,平台也及時傾聽使用者回報并改進資料開放體驗。

在政策保障方面,英國具有完善的政府開放資料政策法規體系。近年來,英國政府高層一直将政府資料開放作為國家戰略進行推動。2010年,英國首相卡梅倫提出緻力于打造“世界上最開放、最透明的政府”。在資料開發戰略規劃上,2011年至2019年,英國連續釋出四份《英國開放政府國家行動計劃》。在開放資料标準上,2010年,英國釋出《公共部門透明委員會:公共資料原則》,提高資料開放形式、格式、許可使用範圍等14項原則。2012年,釋出《開放資料白皮書:釋放潛能》,提出資料開放的五星評價标準和專門的“開放标準原則”。在開放資料創新利用上,英國政府倡導資料分析與可視化技術的創新,獎勵推動開放資料創新的最佳組織。

在組織機制方面,側重于“互相協同、共同推進”。首先,英國十分注重明确資料開放的責任主體。例如,英國内閣辦公室為資料開放上司機構,主要負責協調和監督各機關資料開放工作,并負責制定與資料開放的相關政策法規。此外,英國還設有開放資料研究部門等。其次,英國組建了推進資料開放的專門機構。2011年,英國設立了資料戰略委員會和公共資料集團,前者向内閣大臣提供資料釋出建議,管理與公共資料集團合同,以及為中央和地方的開放資料機構提供資金等;後者則緻力于以低廉的價格為資料使用者提供服務,為中小型企業和非營利機構使用資料掃清障礙等。

近年來,由于資料開放分享主要集中于政府公共資料領域,是以歐盟的資料開放分享主要由各成員國各自主導。但在歐盟層面,相應的資料開放分享工作也在有序開展,重點是在制度層面尋求歐盟範圍内的統一,以便利化資料在歐盟内部的自由流通。

歐盟于2020年初釋出《歐盟資料戰略》,試圖通過加強資料流通,建立真正的歐洲單一資料市場,其中公共資料的開放分享是重點。一是加強歐盟層面在資料公共空間使用資料的治理機制,優先通過标準化活動,形成資料集、資料對象和辨別符的統一描述,促進各領域間的資料流動,以符合GDPR的方式保證資料在技術層面具有可用性。二是使以公共利益為目的的個人資料使用(即“資料利他主義”)更加便利。三是緻力于實作更多高品質公共資料的再利用,使資料集在歐盟内部可以通過機器可讀的格式利用API免費提供。2020年底,歐盟釋出《資料治理法》草案,進一步要求確定公共部門資料在受他人權利限制(如GDPR)的情況下,允許出于“利他目的”重複使用。

總體來看,發達國家政府資料開放具有以下三個方面的特點:一是各國基本建立了全國性的“一站式”政府資料共享平台。除美國、英國外,加拿大、德國、法國、日本和紐西蘭等主要發達國家近年來均建立起全國統一的“一站式”政府資料門戶網站。資料開放的領域集中在農業、經濟、環境、教育、交通、健康、能源、科技等與公民密切相關的領域,提供PDF、HTML、CSV、XLS、API等多種形式的資料格式。

二是基本建立了較完備的資料開放分享法律體系和落實機制。209年之後,加拿大出台《資訊擷取政策》等,明确政府資訊擷取管道;德國通過實施《資訊自由法》等系列法律,明确政府資料的公開性和透明化原則;法國頒布《“數字共和國”法案》《公衆與政府關系法》等,強調政府資料開放和資料安全。與此同時,各國與美國、英國類似,也建立了特色鮮明的資料開放分享落實機制。其中,德國專門設立開放資料機構,建立跨級别、跨行業的資料開放協調辦公室。

三是在開放資料利用開發方面進行了多種創新,包括資料分析機制、有償利用機制、多主體開發利用機制等。英國标準協會(BSI)和德國标準化協會(DIN)針對公衆使用國家标準的有關資料制定了分級收費機制,在創新領域或政府資助的項目中提供一些免費的标準或公用規範,而其他領域的國家标準資料資源則需要通過購買才能擷取。各國均倡導社會多主體參與資料開放分享。例如,2010年,美國聯邦政府與健康服務企業、醫藥實驗室、零售藥房供應商與州免疫資訊資料庫等合作推出“藍紐扣”計劃,消費者使用“藍紐扣”擷取個人健康資訊副本,以便管理其健康、經濟狀況,并與資訊提供方交換資訊。2012年,美國政府與電力行業合作推出“綠紐扣”計劃,為家庭與企業提供能源使用資訊,并幫助他們節約能源。

從效果上來看,資料開放分享的确對社會治理和經濟發展起到了較明顯作用。研究發現,資料開放分享之後,大量基礎資料成為社會基礎設施,吸引了相關商業機構、科技機構、中介組織等對資料的利用。例如,社會組織“為美國程式設計”利用美國波士頓市政府開放的13000多個公共消防栓位置資料,向本地居民發起“領養”消防栓活動,解決了該城市冬天消防栓經常被大雪掩埋導緻火災時消防員延誤救火的痛點。新加坡近來利用政府開放資料實作了登革熱傳染疾病的群防群治等。

二、發達國家企業資料開放分享探索

政府各部門公共資料開放在資料開放分享中占有大部分權重,此外,企業主體的資料開放分享也在探索中,其中金融領域的資料相于資料相對标準化、價值含量高,成為企業資料開放的領頭羊。近年,全球範圍内興起的開放銀行(Open Banking),是金融領域資料開放分享的典型創新。

開放銀行,是一種旨在實作“銀行無處不在”的發展政策,方式包括銀行業向第三方機構開放金融服務接口和資料,或将第三方場景服務引入銀行業務等,其目的是将金融服務嵌入各類商業、生活場景,發現并滿足使用者各種新型金融需求,實作資料融合和金融服務下沉。例如,近年來花旗銀行和澳洲航空(Quantas)以開放AH模式推出新型聯營信用卡,客戶可以直接在澳洲航空 App 上完成從開戶到支付、還款的全部互動過程,澳洲航空負責賬戶管理,并且和銀行資料分享。再例如,高盛和蘋果公司合作推出數字信用卡Apple Card,蘋果的硬體、軟體和使用者資料與高盛的金融服務無縫連接配接,共同為雙方素未謀面的海量使用者提供全新體驗的移動網際網路消費金融服務。

近年來,随着開放銀行理念的發展,賬戶資料整合成為美國和歐洲等成熟市場智能投顧平台的普遍實踐。賬戶資料整合和理财規劃功能在提升家庭長期财務規劃意識方面能夠發揮非常重要的作用,也是投顧人員全面了解客戶非常好的工具。美國的 Mint公司具有很強的代表性。根據官方網站的資料,Mint 目前擁有約5000萬客戶,客戶可以通過授權在 Mint網站上管理美國幾乎所有的金融賬戶儲蓄、抵押貸款、汽車貸款、信用卡、學生貸款、養老金和股票等。該公司已與美國多家金融機構簽署了資料共享協定。通過一站式資料收集,Mit還提供增值服務,如消費者财務分析,财務規劃和賬單支付為客戶帶來了極大便利,為客戶增值創造了機會。

順應個人賬戶資料整合的市場需求,歐美市場還發展出一批專門為創新型企業和金融機構提供個人賬戶資料連結的中間層企業Yodlee 是美國一家領先的資料聚合和分析平台公司,其提供三類API 産品:一是資料聚合 API,利用機器學習和資料科學算法識别賬戶交易資料并将其分門别類,進而為上層商業生态系統内的第三方公司提供精确、清晰、标準化和易于使用的交易資料源;二是賬戶驗證API,以往銀行賬戶驗證過程需要花費數天時間,甚至需要客戶核實銀行賬戶中的小額存款以驗證賬戶,而 Yodlee的賬戶驗證API将此過程縮短至秒級,客戶隻需要輸入網上銀行憑證即可實時驗證賬戶内餘額;三是資金流動 API,使用Yodlee的 API平台,客戶可以通過第三方應用程式連接配接到自己的銀行賬戶,并在一個安全的支付環境中轉移資金。

此外,發達國家金融機構在服務中小企業方面正從支付、信貸等單點金融服務方式,向多元化、全流程的生态服務方式轉變,該種服務轉變也離不開資料融合利用。例如,美國智能财稅服務巨頭Imtuit公司充分利用自身的财稅服務和資料價值,與市面上主流中小企業服務平台進行深入合作,建立全方位、全流程的中小企業服務的開放生态,具備了為中小企業提供财務、稅務、薪資、支付、理财等綜合服務能力。

三 中國資料開放分享的發展情況

大陸也極為重視資料開放分享戰略。黨的十八屆五中全會通過的(中共中央關于制定國民經濟和社會發展第十三個五年規劃的建設)提出,“實施國家大資料戰略,推進資料資源開放分享”。國家大資料戰略,旨在全面推進大陸大資料發展和應用,加快建設資料強國,推動資料資源開放共享,釋放技術紅利、制度紅利和創新紅利,促進經濟轉型更新。

大陸目前雖處于資料開放分享的發展初期,但在借鑒國際經驗的基礎上,結合建設數字中國、數字政務以及數字經濟基礎設施的建設需求,大陸開展了大量資料開放分享實踐,在取得一系列成效的同時,還探索了中國特色的數字政務模式,以及企業資料融合模式。

一、大陸政府資料開放實踐

大陸雖然尚未形成國家層面的“一站式”政府資料開放分享和開發利用平台,但政府資料開放進展迅速、喜人。2012年,上海市政府推出大陸首個公共資料開放平台(https://data.sh.gov. en),之後北京、湛江等地也建設了自己的網站。在2015年國家出台《促進大資料發展行動綱要》之後,大陸政府資料開放平台呈現爆發式增長。據複旦大學與國家資訊中心數字中國研究院聯合釋出的(2020下半年中國地方政府資料開放報告》,截至2020年10月,大陸已有142個省級、副省級和地級政府上線了資料開放平台,與2019年下半年相比,新增4個省級平台和36個地級(含副省級)平台,平台總數增長近4成。

在建設模式方面,大陸省級開放平台分兩種,一種是省統一建設平台并為各地市提供資料存儲、安全和門戶個性化定制等服務;另一種是省市獨立建設,互相之間關聯性低,該情形相對較為普遍,

在平台功能方面,各地已建開放平台基本包括資料目錄預覽、資料分類檢索、資料詳情、資料下載下傳、接口服務和功能交流等功能。部分地方還增設了資料可視化分析大屏、分析工具、智能客服等功能。

在開放資料數量方面,全國開放資料集總量已從2019年10月的71092 個增長到2020年10月的98558 個,增幅接近40%。然而,各地之間的開放資料集總量仍差異顯著,約20%的地方平台已開放的有效資料集總量超過了1000個,其中山東的威海、煙台、棗莊等地區開放的有效資料集總量最高,但目前還有約50%的地方開放的有效資料集在數量上不到100個。從資料容量來看,截至2020年10月、各地開放的有效資料集的總容量接近19億個,與2019年同期相比增長約23%。然而,各地開放的資料容量大小差異顯著,江與溫州兩地平台上開放的可下載下傳資料集的資料容量已分别超過1億個,但仍有約43%的平台上開放的資料容量在100萬個及在開放資料品質方面,約35%的地方平台提供了優質資料集,但優質API接口屈指可數。

各地提供的 API接口普遍存在調用難度高、調取資料容量小和資料更新頻率低等問題。在開放資料标準上,超四成地方平台缺少專門的開放授權協定,僅有不到兩成的地方平台為資料集标示了多種開放類型。在開放資料持續性方面,僅有不是一成的地方平台能在近兩年半以來每個季度都能持續新增資料集;019年第二、第三季度,近四成的地方平台沒有更新資料集。

近年來,黨中央、國務院和國家有關部委高度重視政府資料開放分享工作,相繼釋出了一系列政策、法規指導各地加快建設資料做平台。2015年9月,國務院印發《促進大資料發展行動綱要》,提出“加強對政府部門資料的國家統籌管理,加快建設國家政府資料一開放平台”。2016年7月,《國家資訊化發展戰略綱要》印發,要求建立公共資訊資源開放目錄,建構統一規範、互聯互通和全可控的國家資料開放體系。

國務院辦公廳于2016年、2017年相繼出台《政務資訊資源共享管理暫行辦法》《政務資訊系統整合共享實施方案》,要求将政務資訊系統納入共享範疇,推進全國政務資訊整合共享。2017年2月,中央全面深化改革上司小組通過《關下推進公共資訊資源開放的若幹意見》,提出進一步強化資訊資源深度整合;發揮市場優勢,促進資訊資源規模化創新應用。黨中央、國務院于2020年3月30日頒布的《關于建構更加完善的要素市場化配置體制機制的意見》指出,要加快培育資料要素市場,促進重點領域政府資料開放和資料資源有效流動,擴大農業、工業、交通等重點行業的政府資料開發利用場景。

大陸還有近20個省級行政區頒布了公共資料管理辦法或資訊資源共享管理辦法、總體規劃,廣東、山東等省份還釋出了公共資料開放的地方技術标準和規範,對資料開放涉及的基本要求、分級分類、脫敏和名額評價等進行了探索。

不過,總體來說,與西方主要發達國家相比,大陸政府資料開放分享政策、法律體系還處于建設階段,尚未出台全國層面的關于政府資料開放、開發利用的系統性的法律法規,更缺乏辯證統一的權威法律體系,也未有專門針對資料隐私保護的法律。

目前,大陸政府資料開發利用的程序集中于地方政府資料的集聚和開放分享階段。在政府資料開發利用的典型工作上,交通運輸部、教育部、生态環境部等部門積極響應國家大資料戰略行動,出台指導性部門規章,在交通、醫療、氣象、教育等重點領域推動政資料開放和融合應用,推進政府資料資源開發程序,上線了服務交通、教育、健康等的有效應用。此外,上海開放資料創新應用'、青島市政務資料中台等地方政府資料的探索利用均取得了顯普就效。不過從整體來看,大陸現有資料開放分享中,利用國家政開放資料進行公共服務或商業應用的亮點開發行動還是非常不足的,對行業開放資料的挖掘不夠深,未來政府資料開發利用的深度看待進一步加大,進一步釋放應有的潛力。

二、大陸打破“資料孤島”的數字政務創新

大陸在加快建設“一站式”政府資料開放分享和開發利用平台的基礎上,還在進行具有中國特色的公共資料融合利用模式創新——數字政務“一網通辦”。

近年來,大陸各級、各地的數字政府建設取得顯著成效,以“聯網+政務服務”為代表的舉措已全面鋪開。大陸數億居民線上下基本實作“隻進一扇門”“最多跑一次”的基礎上,線上上也能實作“一網通辦”,數字生活水準在全球居于領先位置。2018年起,愛國政務服務“一網通辦”還與國内大型網際網路平台合作,利用數字科技手段提升使用者精準觸達和智能服務水準。

大陸政務服務“一張網”已初步形成。2018年10月,西藏自治區政務服務網開始試運作,标志着大陸32個省級政務服務平台已基本建成。2019年5月,國家政務服務平台上線試運作,聯通了32個地區和 46個國務院部門,标志着以國家政務服務平台為總樞紐的全國一體化政務服務平台架構初步建成。①通過打造全國政務服務“一張網”,全國一體化平台标準規範體系、安全保障體系和營運管理體系已基本建立,這讓大陸政務服務資料共享水準有了顯著提升。

三、大陸企業資料開放分享探索

在公共資料開放之外,近年來大陸也在企業資料開放分享方面進行了富有成效的探索。例如,商業銀行與三大電信營運商、公安系統通過資料合作,共同開展金融反欺詐業務。再例如,在中央網信辦指導下,公安部門與阿裡巴巴集團等網際網路平台通過資料融合,上線“團圓”系統(公安部失蹤兒童緊急釋出平台),利用高科技和資訊化手段以“網際網路+打拐”的形式,在近年成功找回數千名失蹤兒童。

在金融領域,在使用者授權基礎上通過資料融合提升金融服務廣度和深度,也是大勢所趨。近年來,作為數字信貸的一種創新模式——網際網路聯營貸款——在中國快速發展,網際網路聯營貸款可以視為大陸典型的企業資料開放分享模式之一。

聯營貸款/助貸模式是金融機構和網際網路平台優勢互補的有效分工合作。現有金融機構主要依托線下網點展業,其優勢在于資金成本低、資金管道多元化,同時擁有客戶的強信用資料。但對于服務長尾客群有兩大困難:一是難以有效觸達客戶或者觸達成本高;二是風險評估、管理難,長尾客戶由于缺少征信記錄和抵押物,對金融機構的事前風險評估和事中風險管理構成很大挑戰。金融科技平台的優勢是能夠較快、低成本觸達使用者,并能通過大資料來精準和動态地評價使用者風險,但總體資本規模小、資金管道缺乏,也嚴重制約了金融服務能力的發揮。

通過聯營貸款合作,商業銀行通過網際網路平台的多元度大資料的分享,拓展了獲客管道,降低了資訊擷取成本,提升了風控效率;網際網路平台則為客戶提供更好的消費體驗,促進業務增長;消費者則獲得了更好的消費體驗、更低的信貸門檻和貸款利率。

五 資料開放分享的未來模式:分布式資料價值分享

資料開放分享對于各行各業數字化更新、降本增效,消費者福利增加,以及國家經濟結構深刻轉型均有重要意義,加強資料的開放分享是全球大趨勢。與此同時,資料開放共享并不簡單,需要有創新的解決方案,以化解面臨的挑戰,走出一條多方共赢的、可持續的資料開放分享道路。分布式+注重資料價值的分享模式,可能會成為未來主流模式。

一、資料開放分享面臨的挑戰

第一重挑戰是資料分享方會面臨合規、輿情等風險,“不敢分享”。直接傳輸和分享原始資料的方式,容易造成個人資訊洩露和濫用,如果第三方産生侵犯個人隐私、資料洩露等事件,資料分享方同樣會被認為難辭其咎。比如,劍橋分析資料洩露事件中,劍橋分析公司(Cambridge Analytica)為了吸引更多的人參與,他們還為使用者提供5美元的獎金,使用者隻需回答一些無關緊要的測試問題,就可以獲得獎金,而前提是将部分Facebook 資訊授權給這個第三方程式。在這個事件中,Facebook“被動”分享了使用者資訊,但其因為對第三方程式的風險把關不嚴,依然負有不可推卸的責任。

第二重挑戰是資料分享方的财産性權益難以有效保障,“不願分享”。資料作為一種虛拟資産,具有複制成本低的特征。直接傳輸和分享原始資料的方式,無法對分享出去的資料進行有效的管控和保護,可能被複制和濫用,不僅損害資料分享方的商業利益,甚至導緻資料安全隐患。在缺乏機構互信的情況下,資料可複制性進一步阻礙了資料的跨機構聯合應用。

二、“分布式資料價值分享”是未來資料開放分享的核心特征

少部分人士提出,可以采用集中式、大一統的資料管理和強制性的資料開放模式,但該方案無法解決安全、激勵和創新問題,可能難以持續。以大資料時代的資料量級,所有資料集中存儲和調用的成本極高,且極易産生資料安全漏洞和個人隐私保護漏洞。更為重要的是,資料不是自然存在的,而是生産出來的。資料是相關主體投入存儲、算法、算力、技術人員等“生産”出來的,是從非結構資訊中記錄、清理、整合、提煉、加工出來的。原始大資料的收集、資料處理技術的引入和研發,個人資訊保護和資料安全合規成本的投入,以及相關裝置購置等,均需投入巨大的成本。如果不尊重和保護資料生産者的财産權益,會降低機構進行資料生産和積累的積極性。

最高人民法院也對資料生産者的财産權益表示了認可,在《最高人民法院關于支援和保障深圳建設中國特色社會主義先行示範區的意見》《最高人民法院關于人民法院為北京市國家服務業擴大開放綜合示範區、中國(北京)自由貿易試驗區建設提供司法服務和保障的意見》均明确指出,“依法保護資料要素市場主體以合法收集和自身生成資料為基礎開發的資料産品的财産性權益”,這也已成為司法實踐中遵循的原則。

目前,主流觀點認為,對于資料開放分享,還是應該堅持市場機制在資源配置中的決定性作用。隻有尊重和保護市場機構的權益,才能激勵市場機構去進行資料的生産、積累和向業務價值的轉化。相比于“大一統”,“分布式”分享符合市場化原則,“分布式”會成為未來資料開放分享模式的核心特征之一。

注重資料價值而不是資料本身的分享,是未來資料開放分享模式的第二個核心特征。對于資料要素市場的建構,把原始資料拿出來交易隻是其中一種方式。資料作為企業的生産要素、國家的戰略資源和個體的數字人格,承載着多元利益,将資料簡單化視為一般商品拿來交易的思路,沒能洞見資料利益的多元性。過去的實踐也證明,這種模式并不成功,而且引發了一些問題。中國網際網路金融協會釋出的《金融業資料要素融合應用研究》指出,“資料要素融合是指在資料要素化背景下,對單一或多個資料源的資料進行關聯、組合等操作,進而獲得更好的資料處理效果。傳統的公開資料搜集、原始資料共享等融合方式存在一定局限性”。

資料價值的流通是資料流通的核,把握住這一點,我們将會看到很多新的解決思路。通過搭建資料價值的互聯互通網絡,在確定資料安全可控和隐私保護的同時,實作資料的“可用不可見”“定量定向使用”,進而建構出一個分布式資料價值流通體系,這或是大陸資料要素市場建設的未來方向。

中國人民銀行于2021年2月釋出的《金融業資料能力建設指引》提出,“建立資料規範共享機制,在保障原始資料可用不可見的前提下規範開展資料共享與融合應用,保證跨行業、跨機構的資料使用合規、範圍可控,有效保護資料隐私安全,確定資料所有權不因共享應用而發生讓渡”。這正是“分布式資料價值分享”模式的具象表述。

近年來,快速發展起來的隐私計算技術(多方安全計算、聯邦學習、資料可證去辨別化等)已成為分布式資料價值分享體系的技術底座(關于隐私計算的技術體系和應用,将在第六章詳細展開)。《積極培育壯大資料産業(人民要論)》指出,資料的“價值釋放模式不斷創新。随着資料要素市場快速壯大,資料要素價值實作手段持續豐富完善。流通技術方面,資料沙箱、聯邦學習、多方安全計算等創新技術,能夠在原始資料不洩露的前提下實作合法合規的資料開放,幫助多個機構在滿足使用者隐私、資料安全和法規要求的同時,進行資料使用和機器學習模組化”。

中國網際網路金融協會釋出的《金融業資料要素融合應用研究》也強調,“運用多方計算(業界亦稱多方安全計算或安全多方計算)、聯邦學習等技術,推動金融業資料要素在確定安全合規前提下實作融合應用創新,在促進金融業數字化轉型、增強數字普惠金融水準、落實金融消費者保護要求、提升金融穿透式監管效能等方面具有重要意義。”曆史總是在不斷解決問題的過程中進步,而技術創新正是為解決問題而生,相信在技術創新的加持下,分布式資料價值分享體系指日可待。

繼續閱讀