天天看點

邬賀铨:大資料共享與開放面臨哪三大挑戰?

2013年,在北愛爾蘭召開的G8會議,簽署了《開放資料憲章》,提出了開放14個重點領域資料。要求釋出的資料不是一般的資料,而是高價值的資料,不僅僅是加工過的資料,還要有源資料。以往我們認為,政府釋出的資料是加工過的,實際上隻要不影響國家安全和公民隐私,政府應該開放原始資料。開放的資料要完整的、重要的、及時的。共享是政府部門之間、政府和機關之間,開放是對社會。

聯合國電子政務發展指數包括三項,資訊基礎設施、人力資源和線上服務情況。其中,線上服務與開放資料有關。據統計,2016年開放電子政務資料發展最好的是英國,中國排第63位。政府開放資料需要技術架構支援,包括開放資料管理、開放資料技術和開放資料門戶。

大資料的共享與開放

國務院《促進大資料發展行動綱要》提到,推動政府資訊系統和公共資料的互聯共享,避免重複建設和資料打架,增強政府的公信力,促進社會信用體系建設。

大資料共享包括政府部門之間的資料共享、跨行政區域政府間的資訊共享、政府與企業間資料的合作和共享、企事業機關之間的資料共享等。

政府層面,需要設立大資料協同管理機構,促進政府部門間的資料共享,但是必須要健全大資料相關制度架構和制度體系。另外,需要進一步建立基礎資料庫,一方面要集中存儲被共享的資料,同時進行清晰校驗和整合,提供可以共享的目錄,以便使用者可以接入和收取這些資料。當然,還要規定通路的權限和進行災備等。

中國政府資料開放平台分布較不均衡,其中沿海經濟發達地區占總數的70%,西部中部比較少。雖然中國政府開放了教育、醫療、文體、環境等方面的資料,但是開放資料的總量偏低、結構化程度低、資料品質不高、群眾參與回報不準。

資料共享和開放現在面臨三大挑戰:第一,不願意共享開放,政府部門各自為政、把資料開放當成自己的權利。第二,法律法規制度不夠具體,不清楚哪些資料可以跨部門共享和向公衆開放。第三,缺乏公共平台,共享管道不暢。

大資料的流通與交易

資料有提供方和使用方,很多時候,資料需要通過中介方進行交易。政府開放的資料是脫敏以後的原始資料,資料挖掘公司将政府資料加工後出售給資料使用方、行業戶。一般來講,資料生産者很少直接面向最終使用者,大多通過中介管道實作自身資料的變現。

大資料交易的關鍵是對資料品質的要求,包括資料的準确性、真實性、完整性、一緻性等。關于交易資料合法性、及時性、可用性、安全性等問題,都是現階段我國資料交易所面臨的問題。

政府的資料不存在提供給中介方交易的問題,當然,中介方可以收集政府的資料進行加工。營運商收集的使用者資料原則上所有權是使用者,BAT收集的資料原則上所有權是使用者,但是營運商和BAT擁有對資料脫敏及挖掘分析後加工資料的所有權。有資料的公司通過資料挖掘向政府和企業提供咨詢報告,這類公司雖然沒有資料所有權,但是有資料挖掘能力;而那些沒有資料,但是有資料挖掘能力的公司,可以受委托完成資料挖掘。是否允許前者在保護隐私和國家安全的情況下提供資料,是否允許後者受委托進行資料挖掘後利用資料為非委托方服務,這些問題現在還沒有明确規定。

此外,沒有資料也沒有挖掘能力的公司,可以作為中介平台,但是是否可以允許其截留資料呢?中介方收集了政府開放的資料據為己有并且出售是不是合法?是以,關于在資料源的穩定性、更新頻率和資料擴散等方面,也需要相關規定給出明确的界限。

精加工的資料、可視化的資料怎麼定價,怎麼衡量資料挖掘的工作量,一次性買斷的資料和可以重複多次出售的資料怎麼定價,資料的價值與時效性有什麼關系,是不是需要有對資料評估的第三方機構,都是現階段國内資料流通和交易存在的問題。

政府和企業組織沒有充分認識到用外部資料可以對自身工作和業務起到巨大的提升作用,是以,一般來講都很少利用外部資料。很多資料擁有者對資料蘊含的價值缺乏足夠的洞察,不放心讓自己的資料進入流通環節,擔心企業機密洩露。是以,流通也不夠,交易也不夠,利用更不夠。

大資料利用和保護

目前,歐盟制定了嚴格的資料保護法案,中國雖然有宏觀上的資料保護要求,但是沒有全面的資料保護法規。

多中繼資料是跟個人隐私、專業、公共生活有關的任何資訊,包括姓名、照片、電子郵件位址、工作表現、經濟狀況、健康狀況、個人偏好、興趣、IP位址等。針對個人資訊的收集、記錄、組織、建構、存儲、修改、咨詢、使用、傳播和其他應用,包括排列組合,都可以通過人工處理或自動化處理。

個人具有管理自己資料的權益,具有自己的資料被洩露能夠獲得及時通知的權利以及被遺忘權。對個人資料處理,要合法公正透明,必須有規有法。隻有為了公共利益或曆史研究,個人資料才能長時間存儲,其他目的個人資料不能長時間存儲。同時,還要保證收集的個人資料有技術措施保證,不能被非法授權、非法處理、遺失丢失和損毀。

并不是說個人資料不能處理,符合規定的可以處理,例如本人同意可以作為一個或多個特定目的的資料。個人資料處理是為了保護自己,保護一個自然人的切身利益;為了公共利益,為了追求合法利益的必要,允許商業利用。商業部門、企業處理個人資料,首先是為了合法利益,當然不能侵犯提供個人資訊資料的消費者的利益,尤其是兒童。現在幾乎所有APP都收集個人資訊,如果是為了合法利益的,是被允許的。有個社會調研,關于是否願意為了将來應用資費上的優惠犧牲隐私,全球有27%的人表示可以犧牲隐私,中國有38%的人表示可以犧牲隐私,更多中國人認為隐私不重要,反而優惠更重要。

資料的傳輸存儲和開發要有要求。所有的軟體,包括移動應用的APP,在開發階段和運作資料處理階段要保護個人資料的隐私。資料控制也含APP,要有充分的技術和措施,確定資料和移動應用的完整性,必須應對資料處理面臨的風險。

我國有一些關于資料開發應用的檔案,工信部出台的“大資料産業發展規劃”,2016年出台的“網絡安全法”,都提到對個人資訊和重要資料的境記憶體儲,需要保護資訊安全和個人隐私。但是,跟歐盟的法規比,我們的規範都很宏觀,真正違反了會怎麼樣,并沒有規定。

資料的價值在于融合與挖掘,政府資料對公衆的最大利益在于共享與開放。資料流通與交易有利于促進資料的融合挖掘。資料的使用必須面對保護的責任與義務,尤其是對個人隐私資料的保護。資料的共享開放、流通交易和保護與安全,對資料技術提出研究挑戰,資料的共享、開放、流通、交流、使用和保護對法律的制定與執行提出了很高要求,同時還需要平衡資料的保護與資料的開發利用。

原文釋出時間為:2017年8月9日

本文來自雲栖社群合作夥伴至頂網,了解相關資訊可以關注至頂網。

繼續閱讀