1.前言
開放資料運動的興起,一般來說,被認為起始于2009年data.gov的啟動。作為政府透明化工作的重要一步,奧巴馬政府大力推進政府資料的開放,以此來推動政府内外人士對政府運作過程,特别是政府财政預算與開支的監管。也是以,開放資料在發展伊始,常常被認為是政府透明化工作的一環,是政府資訊公開工作的自然延伸,通過提供可實際擷取并易于使用的資料而非紙面或pdf文本資訊,來加強公衆對政府公信力的監管[1]。
而在各國不斷接納開放資料思維,推動本地政府資料開放的同時,我們也不難觀察到,開放資料所扮演的角色正在悄悄發生變化。2013年麥肯錫研究院的報告[2]揭示,開放資料能夠帶來3-5萬億美元的經濟價值,首次讓人們把視線從政府透明化轉向了開放資料的經濟價值。透過美國紐約的bigapps大賽,英國開放資料研究院與nesta的開放資料競賽(open data challenge)等政府牽頭的共創平台,大量基于開放資料的創新應用得以被開發,并進一步得到資助、孵化,進而得以真正落地“政府即平台”[3]的理念,為社會提供基于資料的創新解決方案。而在中國,上海市經濟和資訊化委員會和交通委聯合主辦的上海市開放資料創新應用大賽也秉承着這一思路,通過開放1t的交通資料,激發社會創新力量,最終誕生了橫跨“新能源車”、“交通保險”、“定制公交”等不同應用主題的優秀作品。
在這一系列以開放資料作為基礎的共創活動中,開放資料所扮演的角色不僅僅是為共創提供了必要的資料資源,其本身也重塑了政府與公衆間的互動關系,以資料為紐帶,形成了共同協作的機制,一同解決社會問題。而在這個過程中,我們也觀察到共治共創的實際需求,也在重新定義開放資料本身的運作機制和形式。政府在思考資料開放時,從原本“我有什麼就開放什麼”逐漸過渡到“公衆需要什麼我先去開放什麼”并進一步朝着“我和公衆期望共同解決什麼問題,我就先開放什麼”的開放思路所演變。
而實際上,這場由政府所率先主導推動的開放資料運動,也慢慢影響着社會各界接納開放資料作為跨界協商合作的管道。共享經濟的典型代表企業airbnb,就在2015年底主動對外開展有限的資料開放[4],以期換來社會各界特别是政府對其共享經濟模式的了解,并協商讨論可能的創新監管模式。無獨有偶,專車模式的鼻祖uber也采取相同的政策,主要面向政府做資料開放,以此來換取政府接納專車模式,不再限制非經營性車輛的介入,并尋求協同治理專車的新模式。
面對這一系列的新變革,開放資料已然不再簡單作為透明化的工具,更不僅僅是政府一端的事務,其正逐漸成為21世紀社會協同治理和協同創新的基石,需要社會各界多元的參與及貢獻。而在這個過程中,作為開放資料的實踐者和研究者,我們也需要重新反思開放資料的定位、機制與形式,并探讨開放資料如何更好地服務于社會的共治共創。
2. 政府即平台:可讀可寫的開放資料接口
“政府即平台”并不是一個新鮮的概念,tim o’reilly提出政府即平台的概念是基于其對網際網路的深入了解,從網際網路角度來講,即是政府應當成為社會運作的基礎技術設施,對外暴露其讀寫接口,允許第三方基于接口擷取政府基本服務,進而加值利用,建立起更為使用者導向的對外服務。
而從這一點來看,實際上我們可以認為政府運作開放資料本身就是一個對外提供“讀”接口的過程,雖然這個接口可能有的時候僅是一個資料下載下傳而非真正的api接口。而基于開放資料平台所提供的資料,我們已經無數優秀的應用得以被開發為市民提供服務。最為人熟悉的當然莫過于交通類的應用,倫敦交通局在開放其交通資料後,有超過5000名開發者注冊擷取資料,有超過300多個交通應用幫助人們了解車輛的實時到站情況,超過4百萬人每天在上下班時使用這些應用,規劃自己的出行,無形中這為人們節省的時間可以換算為2千萬到6千萬英鎊[5]。
然而,對于任何一個所謂的“平台”而言,絕不會僅僅讓人“讀”,而不能“寫“。事實上,政府在現實治理過程中有大量面向公衆的服務,這些服務過程從資料角度來看即是由公衆向政府提供資料的過程。比如市民投訴熱線12345服務,是政府接受公衆對非緊急事務投訴的服務,公衆投訴内容即是一種由公衆向政府提供的資料,其包括了投訴内容、投訴針對地點、投訴種類等等,而這樣的服務過程實際也可以接口化,面向開發者提供一個“寫”api,使得資料可以通過api由公衆端流向政府端。這一類型的政府服務資料接口化中,最為著名的就是美國open311接口,它是一個由民間組織openplans所制定并實作的接口标準,起初是為華盛頓311熱線專門定制的一個api,幫助其拓展資料流入的管道,并标準化資料流入标準。而之後,這個接口得到了不同州、市政府的歡迎,甚至開始有歐洲城市也加入使用該接口标準去實作自己政府的311接口。而311接口的實作,使得政府在接受市民投訴的過程中不再局限于電話熱線,而是可以通過由市民自己標明的應用、社較媒體來擷取詳細的資料,不但包括更為精準的經緯度座标,還能獲得額外的多媒體資訊。這些都是原本電話熱線時代所不具備的。
如果說,政府将資料通過接口方式提供給公衆使用是開啟了資料多元化呈現的大門,那麼政府提供一個“寫”接口,則是大大豐富了其資料擷取的管道,雙向的資料接口開放,将政府真正的變成了可讀可寫的平台。
3. 加速“資料”到“服務”的轉化:開放資料的标準化和互通性
對于開發者而言,開放資料雖然幫助他們擷取了原先封閉的資料,并且確定了資料是提供在可機讀格式下而非pdf或這word格式下,但在面對不同地方所釋放的同類資料采用完全不同的資料範式時,也是非常的頭疼。
針對此,于2015年9月正式啟動的國際開放資料憲章[6]就提出了開放資料必須保證互通性的倡議,其提出對于擁抱國際開放資料憲章的國家、地區、城市,都将努力“制定并實作統一、開放的資料标準,進而確定資料的格式、結構和通用辨別符都具備互通性”[6]。而這一倡議,實際上是對于政府開展開放資料提出了更高的要求,不再是簡單要求確定可機讀格式,而是要求特定的資料能夠滿足特定的标準,進而保證其能夠和其他資料釋出者所釋出的同類資料互通。
事實上,對于資料标準的探索美國政府和民間機構已經嘗試了很久。其中最為經典的一個案例就是yelp和舊金山政府共同合作的lives标準。這一标準的誕生起源于2013年初,yelp和舊金山市開展的一項合作:由舊金山市政府向yelp直接提供餐廳衛生檢查結果資料,進而yelp可以在其網站上展現餐廳的衛生情況,幫助消費者找到衛生健康的餐廳就餐。
這可能看上去僅是個簡單的資料共享合作,但實際yelp和舊金山市想的更遠:如何讓更多城市的衛生檢查結果得以展示在yelp上,以及其他的應用中?雖然在2013年不少美國的城市已經開展了開放資料的工作,餐廳衛生檢查的資料也大多數已經開放在本地的開放資料門戶之上,但若仔細檢視各地的資料,就會發現資料的利用者,例如yelp,想要直接使用各地釋出的形式各異的資料是十分困難的,因為不同地方的資料中,所包含的資訊并不一緻,例如波士頓提供的資料中提供了對餐廳違例的具體說明、狀态、等級,而其他地方并不提供這一資訊。而即使多個地方都提供同一資訊,其在資料庫中的表示也會不同,比如同樣是提供餐廳地理位置,有的地方僅提供其文字位址,而有的地方又是以經緯度表示的。
為此,舊金山市的科技部門聯合yelp和紐約市的科技部門一起提出了lives(“local inspector value-entryspecification”)資料标準,該标準對餐廳衛生檢查結果資料應當包含的字段内容和字段要求标準化,其規定将原本複雜的餐廳衛生檢查結果拆分成數張表,包括了餐廳資訊的business表,檢查結果的inspections表,檢查違例詳情的violation表。同時,其也要求各個提供該資訊的城市同時提供資料源說明表feed,以及數值範圍表legend。對于上述任意一個表内的資訊,比如,檢查結果inspections,lives都基于不同州市目前的資料采集标準和記錄方式設定了标準化的字段(見下圖)。
圖 1 lives标準示例——inspection表
同時,為了使得各城市能夠以最低的成本,無論從時間上而言還是從财政上而言,完成工作并快速接納lives标準,資料的提供方式上并未要求使用api,而是簡單要求各城市能夠按照标準要求将所有資料表打包入一個zip檔案,以最簡單的檔案替換更新形式來完成資料更新。這樣做的一個好處是,其操作方式簡單,各地方僅需将資料按照要求制作成對應的資料表,而無需擔心自己是否有能力去開發一個api,或者是否有足夠人力去維護後續的接口更新。目前,已經有多達11個地方按照lives提供了資料,使得yelp可以快速将衛生評價引入自身的平台。而在開放資料平台解決方案提供商socrata的幫助下,lives将會接下來在一個州内的50個郡進一步推廣,同期也将在英國食品标準署推廣進而在多達英國350個地方被使用。
lives無疑是一個成功的資料标準,而在它的發展過程中,不難看出政府作為資料釋出者、企業作為資料消費者都扮演着極為重要的角色,在标準的制定、推廣、采納、使用的生命周期中充分參與和積極回報,才最終使得lives能夠被迅速接納。而lives之外,我們也看到了其他不同類型的資料标準(見表格1)通過類似的方式被制定、推廣、接納、消費,通過标準的制定,資料提供方和資料消費者之間終于說上了一樣的語言。
表格 1各類開放資料标準示例
4. 清晰開放資料的目标:為應用成效而開放
2015年底,普華永道受雇于開放資料研究院和nesta針對開放資料競賽進行了影響力的評估。結果顯示,在2013-2015年的3年間,由7個不同主題組成的競賽成功孵化了21家遊戲的創業企業,而大賽所投入的每一英鎊都将收獲5-10倍的回報[7]。同時,較之經濟受益更令人振奮的是,競賽完全達到了原有的應用成效的預期,通過競賽成功吸引了社會力量,利用開放資料,為社會緊要問題提供了可能的解決思路。
回顧英國開放資料競賽的組織,不得不提到的是其對應用成效的注重(見表格2),所謂應用成效即所期望開放資料能夠被運用于解決何種問題,并能夠取得怎樣的對應成效,這個成效應當是一個可以量化評估的具體目标。而事實上,這一思路不僅适用于競賽的組織,更應當被實際運用于政府規劃資料開放優先級的政策之中。
表格2英國開放資料競賽系列主題及對應挑戰問題
美國新墨西哥州阿爾布開克市的開放資料上司者mark leech近日也撰文[8]提倡在思考該開放什麼資料時,除了應當思考人們需要什麼,也同時必須清晰作為政府期望資料釋放後能夠帶來怎樣的可能成效。以應用成效為導向思考開放資料的釋放規劃有着三點好處:
第一, 作為資料的擁有者,政府部門可以更容易建立起資料開放和自身部門的利益聯系。事實上,一直以來開放資料推進過程中如何擷取相關政府部門支援是一件很令人頭疼的事情。擁有資料的政府部門通常并不認為開放資料是他們需要做的事情,至少聽上去這更多是某一個主管開放資料的部門的主要任務而非他們的。但如果能夠優先思考資料的應用成效,幫助部門從自身角度思考哪些問題期望得到解決,而釋放資料可能可以找到合适的解決方案,那麼這将不失為一個極大的推動力,去推動相關部門釋放資料。
第二, 這使得資料将更具備故事背景,進而和不同資料更自然地聚類在一起。現有的開放資料門戶通常通過資料釋出機構、或者内容主題來分類資料,但事實上這樣的分類方式往往會将解決同一問題的資料再次打散,增加了資料利用者尋找資料的難度,并且也同時丢失了一個絕佳的機會去啟發開發者,如何将一些資料組合起來去解決一個具體的問題。如果能夠提前思考資料的可能應用成效,然後根據應用成效将相關的資料組合歸類,并提供相應的問題背景,那麼資料的使用率将會大幅增加。
第三, 這将幫助政府更好的規劃資料從釋放到應用到真正落地發揮成效的路徑和所需支援。資料從釋放到被開發者加值利用并非是故事的結束,事實上,很多開發者并沒有足夠的能力去推廣應用,或者使得應用真正的以被使用,特别是當一個應用是針對社會公共問題或者服務于政府部門的。為了使得應用能夠真正落地,政府部門還是需要采用諸如ppp模式等方法協助應用落地,發揮真正的作用,才能達成預期的成效。若相關的部門從未在資料釋放前對此有足夠的認識和預期,那麼自然不會去思考如何幫助開發者落地應用,這也正是問題的症結所在。也是以,我們應當鼓勵資料釋出的機構,去真正思考資料的應用成效,對其有所預期,并規劃可能的支援,來實作相應的效果。
5. 以開放為核心的基礎架構:展望多中繼資料開放與彙流
在前言中,我們回顧到,開放資料最初的主要定位是作為政府透明化工作的一環,作為政府資訊公開工作的自然延伸而存在。而如今,開放資料則更多被視作是政府大資料戰略的一部分,其主要目的是釋放政府資料潛力,供公衆特别是專業機構和企業加以利用創造價值。在這一過程中,開放資料的定位則更多是被視作是對目前大資料市場的資料資源補充。然而,開放資料不應當被狹隘的了解為僅僅是一種資料供應的手段,而更應當被視作是一種社會協作治理和創新的基礎體系,其提供的不僅是資料資源,更是一種新的協作模式。
實際上,如若思考目前社會治理範式的革新,我們不難發現,目前的社會治理,因為大量新技術的應用和模式的創新,已經邁入了算法管控(algorithmic regulation)[9]逐漸代替人工管控,多權力中心逐漸代替單權力中心的新形态。共享經濟的治理問題即是一個典型的代表,無論是airbnb還是uber,實質都已經摒棄了原本先準入後監管的傳統治理模式,共享經濟平台以資料為基礎,建構信譽度算法,來實時監管評價并且獎懲進入平台的經營者。而這一過程,實際上也就演變為了由共享經濟平台取代政府作為監管者對經營者做到了更為細緻和實時的監管。這一根本性的變化實際反應了目前社會治理過程中,政府無法再壟斷所有社會治理相關資料,而改由不同具備技術能力的企業和機構來分化這樣的權力,使得原本的單權力中心演變為了多權力中心。
面對這樣的變革,我們見證到是在過去的幾年中不同國家的政府都試圖去把共享經濟平台重新納入現有的治理體系,試圖通過法令将非經營性的車輛、房屋重新排除在市場之外,進而使得監管問題重新回到既有的規則體系裡。但實際這是錯誤鎖定了問題點,問題的根本并不在非經營性車輛、房屋是否可以進入市場,而是政府如何能夠像共享經濟平台一樣,監管好這些在既有政府監管體系之外的經營主體,而這也就直指問題的症結:如何確定不同利益相關體(政府、企業、第三部門等)對已經分散的經營主體監管資料擁有通路和利用的權限,進而可以基于資料去完成必要的監管。
為解決這一問題,政府需要做的不是試圖去要求完全掌握企業資料或取代企業去采集相應資料,而是應當作為協調者去搭建一個用于社會治理的資料基礎服務架構,使得各方的資料得以彙流,而在這個過程中,為了保障各方的均等參與和信任,開放應當是最為核心的理念,即各不同利益相關體應當将資料開放,使得任何第三方能夠通路和利用資料。
在這一過程中,一個重要的問題是我們如何擴充和界定哪類資料應當予以開放彙流。現有的開放資料定義往往将開放的範圍限定在開放公共資料,即由公共資金投入所産生的資料。而實際上,目前的社會運作過程中已不再僅僅是公機構掌握着社會治理的關鍵資料,我們應當拓展和延伸原有的定義,将事關公共利益和社會基本運作的資料納入開放的範疇,界定哪些資料是社會運作過程中,最為基礎的、關鍵的資料,其就應當予以開放,并納入資料基礎服務架構的體系中。特别的,當目前政府積極推進ppp模式吸引社會資本代替原有公機構提供公共服務時,我們要確定開放的理念予以貫徹,確定相應的資料能夠得到及時的開放,進而確定政府本身能夠有相應的資料做進一步的決策監管,同時也確定公衆、第三部門等利益相關體能夠在過程中掌握有關鍵的資料進行監督。
6. 結束語
随着社會多元主體積極投身于社會治理和創新中,資料開放的進化發展将是一個迫在眉睫的問題。本文中所提及的開放資料的雙向接口化,資料标準化,應用成效導向規劃資料開放,以及資料開放作為社會治理基礎體系都是如今各國正在摸索中的新趨勢。作為一個正在追趕西方各國的開發中國家,中國如何在這一過程中摸索出自己的路則是一個需要政府與企業、第三部門、公衆共同努力的事情。
原文釋出時間為:2016-05-06
本文來自雲栖社群合作夥伴“大資料文摘”,了解相關資訊可以關注“bigdatadigest”微信公衆号