資料究竟屬于誰｜重新思考數字化之十一

胡泳/文如今，人類的各種行為被廣泛記錄下來，資料似乎以空前的規模産生。

傳感器、可穿戴裝置和智能裝置不斷将實體運動和狀态轉化為資料點。智能手表可以實時捕捉我們的脈搏資訊，藍牙和 GPS可以記錄我們在哪裡停留購物，攝像頭、機器人、無人機廣泛應用于智慧城市、智慧社群、智能制造、新零售等AI邊緣計算場景，而網絡汽車和自動駕駛依賴于對車輛和交通資料的大規模收集和處理。

在浏覽網際網路或使用社交媒體時，分析工具處理每一次點選。購物興趣和行為被納入量身定制的廣告和産品。精準醫療的目的是在大量病人資料中尋找模式和相關性，并承諾根據個别病人的具體特點和情況進行個性化的預防、診斷和治療。金融行業與資訊技術的融合交彙，推動金融機構不斷發展自身的大資料分析能力，應用于精準營銷、實時風控、交易預警和反欺詐、信貸風險評估、供應鍊金融、普惠金融等方面。工業4.0将制造和生産的步驟資料化和自動化，物聯網則将數字化、資料化和網絡化的對象進一步擴充。

反複出現的現象是，資料處理将變得越來越普遍和強大。生成和收集個人資料已成為當代經濟的一個重要組成部分。現在，我們見證了人類在感覺、架構、思維、價值、溝通、談判、工作、協調、消費、資訊保密和透明方面的轉變。

更不用說疫情對此的助力。公民為防疫目的交出個人資料，包括位置和電信資料，而政府決策人員則通過人群的實時流動資料，掌控封城政策對市民的影響。手機也可以定位并向可能接觸過冠狀病毒的人發送未經請求的短信，提醒密接者注意潛在風險。

中國的健康碼系統更先行一步，根據居民與病毒影響區接觸的密切程度，為他們配置設定不同的顔色代碼，進入公共交通工具、醫院、生活和工作設施的機會都與這些資料聯系起來，進而事實上形成了對居民的“風險評分”。

國際貨币基金組織的兩位經濟學家嚴·卡裡爾-斯沃洛（Yan Carrière-Swallow）和維克拉姆?哈卡薩（Vikram Haksar）指出，新冠疫情将有關資料的兩個基本問題帶入了人們的視線：一是資料經濟本身并不透明，因而時時處處出現個人隐私被侵犯的情況；二是資料大量存儲在私人資料庫内，這降低了資料作為一種公共品的價值。

大資料，撿到歸我

公允地說，這兩個問題長期以來一直存在，隻不過疫情讓其更加凸顯。它們的背後，其實離不開資料時代我們無論如何也無法繞道而行的“天問”：資料究竟屬于誰？

大多數國家都奉行“撿到歸我”的模式，即誰擷取了資料，誰就可以處理、轉售它們。該模式往往會導緻資料收集過多的現象；例如，你會在APP安裝過程中發現，擷取權限的請求五花八門，但絕大多數APP索取的權限與實作功能的需求并不比對。據相關統計，目前在智能手機上平均每安裝1個移動APP應用，就需要擷取15項以上個人資訊。個人變成透明人的趨勢越來越明顯。

作為使用者，你可曾想到，從GPS、麥克風、電腦軟體、手機應用程式、面部識别、生物識别、無人機以及大量部署的高分辨率閉路電視攝像頭等收集的大量資料，都去往了哪裡？

首先，政府依賴對這些資料的收集，來維系社會秩序、開展社會管理；同時，資料也成為那些控制社交媒體、電商銷售和搜尋引擎的大型科技公司所持有的私有财産。卡裡爾-斯沃洛和哈卡薩指出：“由于資料量越大，分析結果就越精準，這反過來又可以吸引更多的使用者下載下傳使用，進而擷取更多的資料和利潤。這些公司為資料戰撥付了巨量資金，這鞏固了它們的平台網絡，也扼殺了潛在競争對手。”

考慮到這些資料的價值，科技公司采取嚴格的資料保密。同時，它們設定技術壁壘，阻礙資料跨平台轉移，導緻出現了平台通過資料“綁架使用者”的普遍現象。這進一步造成資料壟斷日趨嚴重，為擷取更多的資料，科技公司頻繁并購，并不斷向其他産業滲透，加劇資料集中，市場競争規則遭到破壞。

面對政府的監管與使用者的反彈，科技公司一般采取兩種方式為自身辯護：一是聲稱，對使用者資料的采集，均經過使用者的“知情同意”：即使用者讀過隐私協定，了解自己将分享哪些資料、對資料享有何種權利，并同意相關安排。

其實，在實踐中我們都知道，隐私保護中的一個常見現象是“無人閱讀隐私協定”。網絡使用者雖然在使用服務時不得不點開相關的隐私協定頁面，但他們通常會視冗長繁複的法律文本為無物，直奔底下的“同意”按鈕。這就導緻，所謂的使用者同意常常流于形式，勾選同意複選框的授權方式，很難構成真正的使用者知情同意。消費者對數字平台如何使用資訊僅擁有“有限的知識”，甚至不清楚平台何時以何種方式收集資訊、資訊的種類和數量，以及是否會将這些資訊轉給第三方使用。

有觀察者認為：“當使用者在‘同意’企業協定時難言‘知情’，這一點将同時損害使用者和企業雙方的利益：其一，企業可能借機攫奪使用者對個人資料享有的權益；其二，企業也将是以始終面臨資料合規層面的監管風險。”

更何況，相當多的涉及個人資訊的交易，使用者實際上并不知情，遑論交易授權。這就産生了經濟學所稱的外部性：資料交換并沒有充分考慮到隐私洩露的成本。以個人資料過度或超範圍采集而言，采集者給使用者留下了數不勝數的隐患：個人資料在資料主體不知情的情況下被轉移和流通交易，甚至被不法分子以不正當途徑擷取并進行非法交易；個人資料進入非正常營銷活動，大資料被應用于商業殺熟、精準詐騙、人肉搜尋等不法目的；個人資料被過度畫像，不正當分析個人生理健康、興趣愛好、生活習慣、社會關系等個人私密資訊，侵犯了個人隐私權益，危害個人安全。尤為令人擔憂的是，個人特殊資料被非安全形式采集、存儲和流通，包括基因、指紋、孔膜、肖像等個人唯一生物資訊，其一旦洩露，後果将更為嚴重。這是因為，個人生物資訊最為獨特的特性就是它的不可再生性，一旦洩露，就是終身洩露。

科技公司的第二種防衛方式是流傳甚廣的“以隐私換便利”的說辭。大資料蘊含的商業價值不言而喻，因為它可以影響使用者的消費行為，潛移默化地塑造使用者的消費習慣。在這種情況下，科技公司聲稱，這樣的價值交換是雙向的，使用者毋需直接支付經濟成本，就可以體驗很多便捷的資料驅動功能。

然而問題在于，使用者的資料貢獻與價值分享之間，存在巨大的不對等性。随着經濟的智能化，資料對人工智能、機器學習等服務的價值不斷提高，但由于使用者缺乏資料的生産價值方面的知識，使得科技公司具有顯著的壟斷力量并由此擷取高額壟斷租金。

保護性與參與性

在上述背景下，最重要的考量是個人主體的基本權利是否得到尊重，以及如何保障這些權利不受幹擾。一個經常讨論的話題是，必須厘清資料的所有權關系，也就是一個所有者和她/他的财産之間的關系。然而資料财産有其自身的複雜性。雖然資料具有有形的方面，例如它們與技術-物質基礎設施的關系，但它們似乎也與普通資源和有形财産不同。

在一個數字化和資料化的生活世界中，對資料的主張，對于主張個人基本權利和自由，是不可或缺的。這促使我們澄清資料所有權的确切含義，它是如何被證明的，它試圖實作什麼，以及它是否可以成功地用來促進我們的目标。

資料所有權是指對資訊的占有和責任。所有權意味着權力和控制。對資訊的控制不僅包括通路、建立、修改、打包、擷取利益、出售或删除資料的能力，還包括将這些通路權限配置設定給他人的權利。

這是戴維·勞辛（David Loshin）在大資料時代之前就比較早地給出的一個資料所有權定義，當時尚未考慮大資料分析及大資料交易。根據勞辛的說法，資料具有内在價值，同時作為資訊處理的副産品也具有附加價值，“核心是，所有權的程度（以及由此推斷的責任程度）是由每個相關方從該資訊的使用中所獲得的價值驅動的”。

其後，資料所有權概念經曆了複雜的變遷。首先，它可以是一個單純的防禦性、保護性概念。個人需要一個保密的領域，而對其資料的通路和使用的權限允許他們保護這一領域不受國家、公司和其他人的影響。

勞倫斯·萊斯格（Lawrence Lessig）即持此立場，他認為财産權具有工具性價值，因為其促進和加強了隐私：如果我的資料是我的财産，那麼在未經我同意的情況下，拿走、使用或出售它們都是錯誤的。“如果人們把一種資源看成是财産，那麼就需要大量的轉換來說服他們，像亞馬遜這樣的公司應該可以自由地拿走它。同樣地，像亞馬遜這樣的公司也很難擺脫小偷的标簽”。

财産權可以用來劃定一個别人不得幹涉的個人領域。“産權的言談經常受到抵制，因為它被認為會孤立個人。這是很可能的。但是在隐私的背景下，隔離是目的。隐私即是授權個人選擇被隔離”。

同樣，艾倫·威斯汀（Alan F. Westin）聲稱“個人資訊，作為對一個人的私人人格的決定權，應該被定義為一種财産權”，這也是建立在一種工具性的主張上：産權化本身不是目的，而是一種有效的手段。它的價值來自于促成和促進個人控制和保障隐私的能力。

按照這種思路，我們可以想象，至少對于某些隐私洩露事件，可以認定隐私破壞的錯誤性源自它破壞了所有權。當然，反對隐私侵犯的理由也可能在于個人不受傷害的權利，或是個人不被僅僅作為一種手段來對待。

在具體實踐當中，産權化和經營資料的選擇加強了資料主體的控制和權力。萊斯格認為，“如果‘産權'的本質是想要它的人必須與它的持有者進行談判才能得到它，那麼将隐私産權化也會加強個人拒絕交易或轉讓其隐私的權力”。

前述主要是消極的、保護性的主張，即把他人擋在個人資訊空間之外。然而，對資料所有權的作用的立場，也可以通過個人的自性理論（theory of selves）加以了解——什麼構成了自我，以及我們是否認定個人主要是作為公民或特定社群的成員而占據社會角色。

在此，我們可以通過盧西亞諾·弗洛裡迪（Luciano Floridi）的論述獲得啟示。弗洛裡迪對人格的描述建立在“對自我的資訊性解釋”之上。自我是一個複雜的資訊系統，由意識活動、記憶和叙述組成。“從這樣的角度來看，你就是你自己的資訊”。因而，隐私的重要性主要來自于我們作為“互相連接配接并嵌入資訊環境（infosphere）的資訊有機體（inforgs）”的地位。由于資訊對資訊體的自我構成具有重要意義，隐私洩露會侵犯人們的身份。這種情況導緻弗洛裡迪反對基于所有權的隐私解釋，根據這種解釋，“[一個]人被認為擁有他或她的資訊……是以有權控制其整個生命周期，從生成到通過使用被删除”。人不隻是擁有資訊；他們被資訊所構成。是以，弗洛裡迪呼籲“将對一個人的資訊隐私的侵犯了解為對一個人的個人身份的侵犯”。

一方面，弗洛裡迪的自我概念強調了保護與個人領域和人的完整性有關的資訊的重要性。另一方面，他也在暗示，保護雖然重要，但遠遠不夠。個人作為資訊體與他們的個人資訊及其在資訊圈中的嵌入深深地交織在一起。由于資訊體在資訊圈中編織着資訊紐帶，我們可以說，可控的、局部的資訊屏蔽的保留權，使他們能夠與他人互動，并參與社群和社會活動。

這意味着，資料所有權不會總是與假定的權利和機制挂鈎，以限制資料流動。有時，個人會要求他們的資料，并尋求以某些方式分享它們。對于資訊體來說，資料所有權作為孤立的東西是不夠的。它還必須允許參與經由資訊圈居間調停的社會努力。是以，一個人利用自身資料的方式不僅是保護性的，常常也是參與性的。

由此來看，一些關于資料所有權的建議和反對意見涉及真正的财産權，而另一些則涉及某些控制權，而不管這些權利是否符合财産權的條件。有些人認為資料所有權的意義在于将個人置于經營其資料的地位，而另一些人則堅持認為，個人與他們的資料之間的關系實際上激勵着一種完全相反的動機：個人資料的不可剝奪性。根據一些了解，對資料所有權的承認涉及到配置設定保護性權利以及保障和執行這些權利的機制。

但在其他建議中，這還遠遠不夠。資料所有權并不局限于保護性權利，而是涉及更多的内容：使資料所有者能夠享受到社會參與和社會包容。最後，對于資料到底是由個人資料主體、資料處理者和/或像整個社會這樣的集體所擁有，也存在着分歧。

促進資料主體的資訊自決

弗洛裡迪批評資料所有權的保護性語言，是為了強調它實際上僅涉及最字面意義上的自我所有權。而由于資訊與它所構成的資訊有機體之間的密切糾纏，弗洛裡迪要求對資訊的保護應直接建立在後者的規範性地位之上。

“人們仍然可以争辯說，一個個體行動者‘擁有’他或她的資訊，但不再是在剛剛看到的隐喻意義上，而是在一個行動者就是她或他的資訊的确切意義上。‘你的資訊’中的‘你的’與‘你的汽車’中的‘你的’不同，而是與‘你的身體’、‘你的感覺’、‘你的記憶’、‘你的想法’、‘你的選擇’等中的 ‘你的’一樣。它表達了一種構成性的歸屬感，而不是外部所有權，也即一種你的身體、你的感覺和你的資訊是你的一部分，但不是你的（法律）财産的感覺。”

這意味着,“對隐私的保護應直接基于對人類尊嚴的保護，而不是間接通過其他權利，如财産權或表達自由權。換句話說，隐私應該作為一級分支嫁接到人類尊嚴的主幹上，而不是嫁接到某些分支上，好像它是一項二階權利”。

這樣做的一個結果是，資料将變得不适合于市場交易。事實上，弗洛裡迪懷疑，如果他的看法是對的，“個人資訊是……一個人的個人身份和個性的構成部分，那麼有一天，交易某些種類的個人資訊可能會成為嚴格的非法行為”。

上述觀察闡明了當資料所有權被主張時的利害關系。對這些含義的反思會帶來一個實質性的主張：資料所有權的所有這些方面對于資訊層面的自決權都是至關重要的。保護性與參與性兩個領域都需要被考慮，以掌握與資料所有權相關的主張，而對它們進行協商是促進資料主體的資訊自決所必需的。

總的來說，這些差別表明對資料所有權的呼籲并不像人們希望的那樣統一。理由雖然各不相同，但存在一套與資料所有權相關的期望——給那些想要釋放資料經濟潛力的人和那些試圖重新賦權給失去資料控制的個人以希望。這方面我們需要更多的公共對話，以更好地承認資料主體和重新配置設定整個資料驅動的生活世界的資源。

全球性解決方案仍然付之阙如

不過，人們的期望是一回事；政府監管部門的想法是另一回事。2021年8月20日，中國全國人大常委會通過了《個人資訊保護法》（PIPL），與另外兩部法律并行，組成中國治理網絡安全、非個人身份資料和個人資訊的“三駕馬車”。

這“三駕馬車”分别是：《網絡安全法》，适用于中國境内建設、營運、維護和使用網絡的活動，以及網絡安全的監管；《資料安全法》，規範除個人資訊以外的其他資料的安全、治理和交易；PIPL，适用于個人資訊和相關事項。

在草案階段，研究人士即指出，PIPL可能代表了美國的部門方法和歐盟全面的《通用資料保護條例》（GDPR）架構之間的第三種方式，前者對特定行業或消費者類别适用不同的規則，後者則在各種情況下展現了基本權利。在法律的草案階段可以清晰看出，中國不斷發展的資料治理制度在強調消費者隐私的同時，也通過資料本地化措施、跨境資料流動限制以及持續的監控和執法權力，将國家安全放在首位。

事實上，最終通過的PIPL建立了一個類似于GDPR的機制，但它在某些方面的要求更嚴格。比如，PIPL要求在處理敏感個人資訊時應向個人披露更多細節。向境外提供個人資訊的，PIPL要求披露每一個境外接收方的名稱／姓名和聯系方式，并取得個人的單獨同意。PIPL還要求控制者在若幹種情形下進行安全影響評估。PIPL對關鍵資訊基礎設施營運者和處理個人資訊達到規定數量的控制者提出了資訊存儲要求。此外，PIPL對跨境資料轉移實行更嚴格的管控。

從資料治理角度，該法不僅重塑了中國的隐私法，而且還将成為不斷發展的全球隐私格局中的重要力量，亦即成為對國際商業具有高度影響的監管架構。

然而，也正是因為這一點，中國的PIPL與歐洲的GDPR之間，可能會産生互操作性障礙。首先我們必須承認，任何重要的隐私法都不可避免地要被拿來與歐洲的GDPR相比較。這部分是因為它提供了一個全面的架構，啟發了包括中國在内的其他司法管轄區的監管，但同時也因為歐洲的規則适用于歐洲人的資料在世界各地的處理方式，令GDPR成為任何處理跨國個人資料的參考點。

在許多方面，中國的法律顯示出與GDPR的相似之處，GDPR中的幾個被廣泛采用的隐私最佳實踐，包括資料最小化（data minimisation）和目的限制，都展現在中國的法律中。廣義上說，個人資訊、敏感資訊、個人權利和處理的法律依據的定義都與GDPR有相似之處，但其中也存在重要差別，最大的差別在于與國家安全有關的規定。

原則上，GDPR促進了資料的跨境自由流動，提供了若幹法律轉移機制。然而，雖然一些歐盟委員會官員公開批評資料本地化措施，但其他人似乎支援這一概念。在此方面，PIPL發出了毫不含混的資訊。根據《網絡安全法》，包括個人資料在内的關鍵資訊基礎設施（CII）資料必須存儲在中國境内。PIPL将這一要求擴大到了非CII營運商處理的個人資料，代表着《網絡安全法》和《資料安全法》中現有資料本地化措施的擴充，這些措施都與GDPR在滿足條件下實作資料流動的機制相悖。雖然與GDPR的一些差異是可以預期的，但這方面的不一緻可能會破壞資料保護，并可能阻礙資料制度的互操作性。

對于PIPL來說，隐私的追求主要是針對私營部門的風險。盡管個人資料處理規則同樣适用于政府，但現有的制度缺乏明确的措施和界限，以做到在援引國家安全或公共利益時能夠保護公民隐私。在後斯諾登時代，雖然世界各地的公民和政府都在推動保護個人隐私免受政府監控，但仍然沒有一個全球性的解決方案來平衡高度的隐私問題和國家安全需求。

為此，迫切需要在全球範圍内找到解決方案，并對全球監控行為進行改革和提高透明度，特别是在涉及相稱性（proportionality）和個人補救權利方面。在缺乏政府監控和公民隐私的平衡措施的情況下，一國政府若非能夠對自身的監控行為進行重大改革，将難以在全球範圍内有意義地參與這些緊迫的問題。

在當今的全球隐私環境中，世界各地的監管機構當然會關注控制着大量個人資訊的美國科技公司。然而，監管機構也可能意識到，由于中國政府具有廣泛的資料通路能力，将資料轉移到中國的風險将難以緩解。随着中國公司越來越多地在全球範圍内營運，對資料保護的高度呼籲将使中國公司處于競争劣勢。而對國際企業來說，由于中國是一個如此重要的市場，其資料規則對以多種方式與中國打交道的國際企業将産生重大影響，它們的全球監管負擔和地緣政治風險都在增加。

從這樣的角度來看，“資料究竟屬于誰”的問題，牽涉到中國與世界上其他資料保護制度的适當性之争。盡管中國是最大的資料進口國和出口國之一，并且表達了與其他國家互相承認資料保護規則的雄心，但可以預期，中國在全球舞台上推進自身的資料治理模式的挑戰将相當深遠。

（作者系北京大學新聞與傳播學院教授）

資料究竟屬于誰｜重新思考數字化之十一

繼續閱讀

落敗等于賽季結束！皇馬和拜仁八大資料對比，誰能挺進歐冠決賽？

中國人均每年喝幾杯咖啡？大資料來了

川渝大資料産業第二屆職工創新大賽圓滿落幕，優秀作品引領産業發

近視手術大資料《白皮書》釋出——近視手術量三年增長28% 近視手術怎麼選？專家為您解答

請大資料把它推給想懷雙胞胎的人

大資料揭秘：遼籃4300萬球迷，兩廣也有愛

禦芝林獲授健康中國品牌發展論壇首批“保健産業大資料中心資訊采集點”

巧用大資料，天九共享集團打造大共享模式

企業為什麼進行大資料遷移以及注意事項

滴滴出行被投訴價格操縱，網約車大資料殺熟何時能平？

生活中你遇到過“殺熟”嗎？網友：不隻實體店殺熟，大資料也殺熟

大資料推的公認下飯神器，這個菜不管怎麼做，我都會多吃一碗米飯

掃黃将通過大資料進行！深夜觀看不良網站會不會被查到？答案在這

1.13萬篇論文被撤回！學術造假重創美國知名出版商，預計至少損失3500萬美元【附美國教育大資料行業市場預測】

1大資料超喬丹！東契奇31+10+11刷爆神迹，歐文賽後打鼓慶祝搶戲

警惕AI造黃謠淺析大資料掃黃應用中的SNA算法原理