匿名也沒用，你已經在網上暴露了

針對網際網路上的隐私問題，來自普林斯頓大學和斯坦福大學的研究人員釋出的一項研究結果顯示：隻要将你的匿名網頁浏覽曆史記錄和你的社交媒體資料聯系起來，就可以識别你在網上的一舉一動。

“我們發現浏覽器的曆史記錄可以和社交媒體資料相關聯，像是 twitter, facebook 或者 reddit 等賬号。” 研究人員在一份計劃在 4 月份的澳洲珀斯網際網路會議發表的文章上寫道。

普林斯頓計算機科學助理教授、該研究文章的作者之一 arvind narayanan 說：“我們已經知道有一些公司會追蹤使用者的浏覽行為，并且知道使用者的身份，例如 google、 facebook。”但是這些公司公開了他們對注冊使用者的追蹤行為。這項新的研究表明，任何有能力搞到你的浏覽記錄的人 —— 顯然，有海量的公司群組織可以做到這一點 —— 都可以通過分析你的社交媒體賬号上的公開資訊來确定你的身份。

“使用者們可能認為他們在通路一些新聞網站或者養生網站時是匿名的，但是我們的研究又找出了這些公司通過其他手段确定使用者身份的可能性。” narayanan 稱。

narayanan 指出，如今美國聯邦通信委員已經通過一項新的隐私規則，允許網際網路服務提供者儲存和使用一些使用者的資訊，當然這些資訊需要是與使用者身份 “無關聯” 的。

研究人員寫道 “我們的研究表明，匿名的浏覽曆史似乎也不滿足這個條件。”

文章中寫道，線上廣告公司通過在網頁上嵌入追蹤程式來建立使用者的浏覽記錄檔案。一些廣告商會将使用者的身份添加到檔案資訊中，但是絕大多數廣告商都承諾這些網頁浏覽資訊與任何人的身份資訊都無關。于是研究人員想知道，即使這些資訊不包括身份資訊，那我們是否能根據這些來推定出使用者的身份呢。

研究人員決定保守地公開他們自己的一些資訊，在那些包含外部連結的社交媒體資料上格外謹慎。之後他們寫了一個名為 “feeds” 的算法，用來将他們的匿名網站浏覽記錄和社交媒體賬号進行對比。

“每個人的浏覽記錄都是獨一無二的，并且都蘊含着暴露他們身份的蛛絲馬迹。” 斯坦福大學助理教授 sharad goel 說道。

這個叫 “feeds” 的程式可以在不同的資料中找出規律，通過這些規律來推定使用者的身份。研究人員稱這種方法并不完美，需要一個能提供大量外部連結社交媒體。然而，他們說 “隻要浏覽記錄中有 30 條源自 twitter 的連結，我們推斷出對應的 twitter 資料成功率就有 50％以上。”

在由 374 名志願者提供它們的浏覽記錄進行的試驗中，研究人員取得了更大的成功。通過比對網頁浏覽記錄和數億的社交媒體資料，研究人員能夠确定 70％使用者的身份資訊。(試驗中初始的參與者還要更多，但是由于處理資訊時的技術問題，一些參與者被剔除了。)

倫敦帝國理工學院助理教授 yves-alexandre de montjoye 稱，該研究表明 “‘去匿名程式’的建構如此簡單，你隻要知道怎麼寫代碼就行了。多年海量的證據表明資料匿名化具有很大的局限性，這項研究也讓我們重新反思大資料時代下的隐私和資料保護問題。”

匿名也沒用，你已經在網上暴露了

繼續閱讀

jdk1.7+Eclipse+Maven3.5+Hadoop2.7.3建構hadoop項目

HDFS指令行工具

【51CTO學院三周年】自學路上的伴侶

線上教育巨頭多鄰國Duolingo入華一周年，中國市場馬力全開

【分類算法】什麼是分類算法定義分類與聚類分類過程方法

申請評分模型拒絕推斷（RI）方法申請評分模型拒絕推斷（RI）方法

Sql優化一：sql語句優化

Nacos 2.0 更新前後性能對比壓測

尚矽谷—韓順平—圖解 Java設計模式（結構型）（55～）

Storm編譯打包過程中遇到的一些問題及解決方法

MapReduce的幾個企業級經典面試案例MapReduce的幾個企業級經典面試案例

9.spark Core 進階2--Cashe

淺談企業活動中進行資料分析的重要性

Ambari介紹和架構原理

NOSQL安全攻擊

win10本地scala和spark安裝安裝scala安裝spark