天天看點

白宮大資料報告:5點關注隐私

白宮大資料報告:5點關注隐私

報告說,大資料提出了嚴肅的隐私問題以待解決,宜早不宜晚。大資料的潛力是無窮的-可能帶來好處也可能帶來壞處。一份描述大資料的變革特質的白宮新報告深入地探究了與資料相關的隐私和安全主題。

關鍵的關注點:大資料正在創造大量的隐私主題需要及時處理,宜早不宜晚。

該報告的引文說到:"本報告一個顯著的發現是大資料分析将個人資訊用于供房、信貸、雇用、健康、教育和商場購物,有潛力使長期存在的公民權利保護黯然失色。美國人與資料的關系,她(他)們的機會和潛力将得以擴充而不是消減"。

報告讨論了一系列有關隐私的主題,包括以下5個:

1."去識别化"并不總是有效

機構常常采用隐私保護技術來去除與特定個人或裝置資料的連接配接識别性。不幸的是,再識别技術又同樣有效地把這些資料連接配接起來。

報告提出:"綜合性的多種資料可能導緻某些分析師所說的"馬賽克效應",即個人可識别資訊可以從甚至不包括個人識别碼的資料集裡衍生或推斷出來,關注點在于描繪一個人的形象和她(他)們所喜歡的東西"。

随着再識别匿名資料的技術日益強大,個人如何管理她(他)們的私人資訊和身份,或者基于多種資料集資訊做出決策,這逐漸變得撲朔迷離。

2."完美的個性化"可以有助于識别力

報告說,不同類型非結構化資料的融合使得營銷人員可以"在消費者提出要求之前就準确地把她(他)們想要的消息、産品或服務發送過去"。"可惜的是,完美的個性化也為定價、服務和機會方面精細的和不那麼精細的識别力留下了空間。"

3."小"資料造成更大的隐私威脅

不論對大資料潛在侵犯個人權利的言論多麼洶湧,今天大多數最常見的隐私風險都與"小資料"有關,比如黑客以個人銀行資訊為目标實施金融詐騙。報告指出:"這些風險并不總是大量、快速或資訊種類繁多的,也不隐含某種與大資料相關的複雜分析"。報告認為,小資料的保護已經由美國隐私法律、強有力的實施細則,以及全球隐私保護機制修正規範起來。即使這是事實,最近的2篇文章顯示出在這個領域還有很大的改進空間。

4.預測醫學可能導緻隐私混亂

"預測醫學"是一個前景遠大的大資料應用,它深入挖掘病人的健康和基因資訊,以預測她(他)們是否将得一種特殊的疾病,以及對具體治療方法的接受程度。這兒資料濫用的潛力是巨大的。比如,通過"預測醫學"收集來的健康資訊也許就被運用于擁有類似基因的人們(比如病人的孩子們)的醫療決策中。

報告提到:"目前覆寫資訊并運用于健康的隐私架構體系并沒有很好的适應處理這些新發展,或者對驅動新發展的研究起到促進作用"。

5.相反地,隐私法律反而阻礙了某些重要的分析

報告說:"大資料分析使得資料科學家可以積累大量的資料,包括非結構化資料,并且發現異常現象和模式","這個發現模型中一個關鍵的隐私挑戰是,你不得不去大海裡撈針。為了獲得一定的洞察力,你就需要一定數量的資料。"

是以難題就出來了:研究人員可以受益于獲得更大量敏感的基因資訊資料集,但是隐私法律卻限制她(他)們擷取這些資料。報告說,舉個例子,布羅德研究所的一位基因研究者就未能探測與3500個精神分裂症基因資料集相關的基因變異,但卻取得了35000個案例的"統計顯著性"結果。

原文釋出時間為:2014-05-10

本文來自雲栖社群合作夥伴“大資料文摘”,了解相關資訊可以關注“bigdatadigest”微信公衆号

繼續閱讀