天天看點

基于橢圓曲線的混合加密方案(ECIES)

作者:開放隐私計算

開放隐私計算

隐私保護與資料價值之間不可兼得,這是全世界都面臨的問題。保守的國家和地區保護資料隐私的方法就是對其進行加密再存儲在各自獨立的系統中,但是這樣會造成資料孤島現象,無法充分發揮資料價值。

而更多國家,已經在醫療、金融、公共安全等領域,開始廣泛地共享資料解決許多問題,他們運用隐私計算技術對相關聯的資料進行互相配合,進而豐富資料特征次元,建構更準确的模型。

而且技術上随着學術界和工業界對區塊鍊和密碼學的研究和投入力度不斷增加,目前已有多種方法可以在不暴露資料内容的情況下對資料進行計算。

之前我們一直在分享國内的隐私計算技術發展和應用的現狀,本文跳出國内,來看看美國的隐私計算技術發展情況。

目前在美國,隐私計算技術主要用來滿足相關監管要求,但在未來這些技術将可能成為合作各方互相信任的關鍵。區塊鍊和去中心化金融的發展及其帶來的實際落地應用案例帶來了巨大的價值,這些進展比各界預期的要快。

本文将從以下4個部分展開:

1.簡述目前美國隐私計算發展背景;

2.介紹不同類型的資料協作架構:私有資料收集、資料保險庫、資料清理室和無需信任的資料市場;

3.讨論營銷、去中心化金融 (DeFi)、醫療保健和金融領域的新興用例;

4.讨論美國隐私計算技術的現狀和未來展望。

01

隐私計算技術的發展背景

調查顯示,越來越多的美國人對使用者隐私表示擔憂和警惕。這種現象的原因有很多,包括資料洩露事件的增加、《通用資料保護條例》(GDPR)和《加利福尼亞消費者隐私法》(CCPA)等法規的出台,人們對侵入式廣告實踐的普遍意識,以及不斷增加的資料收集量。越來越多的品牌認識到充分尊重使用者隐私可以為自己帶來更正面的品牌形象。

基于橢圓曲線的混合加密方案(ECIES)

越來越多的美國群眾擔心他們隐私資料 (來源: Pew Research Center)

基于橢圓曲線的混合加密方案(ECIES)

每年有數十億條記錄因安全漏洞而丢失(來源:Momentum Cyber Cybersecurity Almanac 2022)

當今數字化業務日常運作中融入隐私保護的需求日益迫切,本文将回答以下幾個問題:

1.如何以保護隐私的方式讓持有私密資料的不同利益相關者進行合作?

2.目前隐私計算技術的現狀如何,以及誰是主要的開發者?

3.哪些行業将采用這些隐私計算技術?

02

不同類型的資料協作方式介紹

資料協作通常是指在創造價值的各方之間共享資料。可以采取移動應用程式收集使用者資料,零售商與品牌交換資料或醫療保健提供商與研究實驗室共享資料的形式。

1.加密的安全資料收集:這是目前大多數消費級應用程式的現狀。使用者資料被收集、加密,并發送到中央伺服器,在中央伺服器上解密并進行分析處理。資料在傳輸過程中進行加密,但伺服器上的資料洩露可能會暴露私人記錄。

2.個人隐私資料收集:像蘋果、谷歌、亞馬遜這樣擁有大量裝置的組織不僅安全地收集使用者資料,還采用隐私計算技術在模糊個人記錄的同時允許進行聚合分析。資料在傳輸和存儲過程中是私有的,是以不會暴露私人資訊。

3.資料保險庫:當組織需要建立多個利益相關方可以在私有資料上執行計算的環境時,可以在安全環境中進行資料計算,同時不會洩露個人身份資訊。例如,資料保險庫可以掩蓋使用者名和郵政編碼,但仍然可以公開使用者事件。可以通過郵政編碼對使用者行為進行聚合,但無法識别單個使用者的郵政編碼。

4.資料清潔區:資料清潔區允許不同團隊或實體共享和協作資料,而不會透露彼此的内容。使用這些方法可能會與私有資料收集相結合,也可能不會。這再次通過使用密碼技術實作,對共享資料上允許的計算進行附加的管理。

5.零信任資料平台:當實體需要在彼此之間進行協作,而不必相信對方時,它們通過分散式網絡實作。網絡的參與者通過確定資料處理的可驗證性以及用于私有資料計算的密碼技術來確定平台的可信性。

1、加密的安全資料收集

基于橢圓曲線的混合加密方案(ECIES)

如今,大多數應用程式使用加密技術将資料從我們的裝置安全地傳輸到中央伺服器。在端到端加密中,資料僅由最終使用者解密,而不是中央伺服器。例如,WhatsApp聊天隻能被參與對話的人閱讀,而不能被WhatsApp的中央伺服器讀取。雖然加密確定資料被安全地收集和傳輸,但它不允許中央伺服器對資料進行任何計算。對于即時通訊來說是可行的,但如果使用者想了解哪種表情符号在某個新功能中使用最頻繁,這就無法做到了。

另外需要注意的是,随着量子計算的最新進展,傳統的加密技術正面臨風險。由美國國家标準與技術研究所(NIST)主導的課題——開發量子計算安全的加密算法以更安全地存儲資料正在進行中。預計在2024年選擇出獲勝算法後,其大機率會得到主流商業應用。

2、個人隐私資料收集

基于橢圓曲線的混合加密方案(ECIES)

如今,大多數網站和應用程式以極高的粒度捕捉使用者行為。他們保證使用者資料在分析過程中将進行個人身份資訊匿名處理,進而保證安全性。然而,黑客曾成功通過将資料與非匿名化資料集進行比對(如Netflix資料)來重新識别此類資料集。

克服這個問題的一種流行方法是使用聯邦學習(Federated Learning),其中模型在客戶裝置上訓練私有資料。隻有模型的輸出被發送到伺服器,進而限制了共享的資料。然而,通常情況下,人工智能模型往往會編碼比必要的資訊更多,并且可能無意中記憶了私人或可識别的資訊。

蘋果通過使用差分隐私(Differential Privacy)收集來自其裝置的資訊,例如使用最常見的表情符号、導緻Safari崩潰的網站以及其他類似的資料點。差分隐私在保護個人隐私的同時,實作了蘋果與谷歌之間在新冠接觸追蹤方面的合作,保護使用者隐私。

差分隐私(DP)是一種典型的隐私計算技術,它允許實體将噪音系統地插入收集的資料中,進而使聚合計算能夠良好運作,而單獨的條目本身則沒有意義。在差分隐私資料上執行的機器學習将繼續保持差分隐私。然而,差分隐私在一定程度上會降低資料的實用性,目前的研究目标是減少噪聲的負面影響。

3、資料保險庫和資料清潔室

基于橢圓曲線的混合加密方案(ECIES)

資料保險庫為資料的存儲和按需通路提供了一個安全的空間。資料保險庫有助于確定選擇性地共享正确的資料,通常被稱為“捆綁”問題。實施資料保險庫的常見用例包括安全存儲個人身份資訊(PII)、支付資料(PCI資料)和醫療資料(HIPAA合規性)。

資料清潔室類似于資料保險庫,用于多方決定進行協作的情況。在資料清潔室中,計算是在不暴露彼此資料的情況下進行的。同态加密(FHE)、安全多方計算(MPC)和可信執行環境(TEE)是該領域的熱點技術。

各大公司正在建立資料清潔室用于在合作夥伴之間共享營銷資料。廣告公司如Facebook、Google和Amazon也通過清潔室與客戶共享資料。根據Gartner的預測,到2025年,50%的大型公司将預設使用隐私增強技術(PET)來存儲其資料,這是一個龐大的市場。

同态加密和安全多方計算(MPC)是在不揭示資料内容的情況下執行計算的密碼學方法。可信執行環境(TEE)是在記憶體中使用的CPU加密隔離的私有區域,用于在硬體級别上保護正在使用的資料。

資料清潔室和保險庫依賴于設立清潔室和保險庫的實體的信任。這對于建立一個品牌進行營銷的生态系統非常有效,但如果涉及數百或數千個實體的大型生态系統,則顯得不足。這就是分散化和無信任資料平台的用武之地。

4、零信任資料平台

基于橢圓曲線的混合加密方案(ECIES)

資料清潔室允許多方(或同一公司的利益相關方)以保護隐私的方式共同處理資料。在清潔室中,隐私取決于由管理者設定的治理規則,管理者将對查詢實施治理。例如,使用者可能希望将醫療記錄與癌症篩查提供者共享,隻是為了進行癌症檢測,不做他用。

去中心化将資料存儲和計算分布在多個節點上,進而實作無信任架構。去中心化還加強了平台的安全性——要竊取資料,必須同時擷取多個節點的通路權限。區塊鍊為去中心化計算提供了基礎,然而存儲在像以太坊這樣的熱門鍊上的資料無法進行加密或保護隐私。

在區塊鍊上存儲私人資料面臨自身的挑戰——很難以去中心化方式适應同态加密等技術。安全多方計算和可信執行環境更适合在去中心化系統上工作。金融機構等大型組織仍在進行區塊鍊試點項目,是以保護隐私的區塊鍊仍在發展中。

如果計算和交易發生在去中心化平台上,可驗證性是另一個重要考慮因素。我們需要確定(A)輸入來自我們相信的實體,以及(B)計算的正确執行。為了解決前者,企業和初創公司正在建構“主權自我身份”的未來,以允許發行和認證明體頒發“可驗證憑證”,通過密碼學方式證明身份的有效性。對于後者,零知識證明是一種密碼學技術,可以驗證計算的正确執行,而不洩露其運作的資料。

零知識證明對于區塊鍊具有巨大的影響。在分散化網絡中,智能合約由多個節點執行以確定準确性,零知識證明提高了速度和可擴充性。以太坊可擴充性的承諾吸引了大量風險資本投入到建構新算法和硬體加速的工作中。

03

美國隐私計算技術的新興案例介紹

1、廣告營銷案例

廣告行業依靠在裝置、浏覽器和其他第一方資料來源之間确定使用者身份來生存。過去幾年中,一系列舉措使廣告活動的測量變得困難,比如蘋果的ATT使得跟蹤使用者辨別符變得困難;Facebook不允許将使用者資料發送給廣告商,隻允許發送給MMP(移動測量合作夥伴,如AppsFlyer、Branch等);谷歌宣布到2023年淘汰第三方cookie;此外,歐盟的GDPR和加利福尼亞的CCPA等監管措施也對廣告活動産生了影響。

通過在廣告活動資料、外部營銷資料(電子郵件、消息)和第一方使用者資料之間進行合作,可以更有意義地衡量績效、建構更好的閱聽人群體并進行深入的廣告活動分析。

通過在離線合作夥伴和線上D2C資料之間進行資料合作,可以為使用者提供更好的全管道體驗。例如,D2C品牌可以與Target等離線零售連鎖店共享資料,以确定哪些客戶購買了産品,并更好地進行廣告推廣。這些用例使得對于擁有龐大營銷預算的品牌來說,資料清潔室成為一種可行的投資選擇,根據Gartner的預測,到2023年,預算達到10億美元的品牌中将有超過80%采用資料清潔室。

Facebook、谷歌和亞馬遜都擁有自己的資料清潔室。這些清潔室允許在事件流的基礎上添加自己的第一方資料,并在一個相對嚴格的環境中進行操作。其他一些公司則專注于建構針對營銷應用的資料清潔室,例如歸因平台或營銷雲提供商。

2、Defi(去中心化金融)案例

目前,在區塊鍊上進行的交易是公開的。使用者可以追蹤與錢包相關的所有交易,并了解該賬戶的交易曆史。在數字資産得到更廣泛傳播的世界中,我們需要機制來保護與我們的交易相關的資料的隐私。美國有42%的機構投資者擁有數字資産,其中74%表示對未來的數字資産有興趣。金融機構也在嘗試将現實世界資産進行代币化,以在區塊鍊上建立債券和股票等證券的世界。

在不穩定的開發中國家,比特币閃電網絡和其他加密貨币推動了點對點交易,隐私成為必需品。如果某天人們在鍊上(比如以穩定币形式)收到工資,當然也不希望這樣的資訊被公開。

鍊上隐私對于DeFi也很重要,因為交易資料的公開性導緻了MEV(礦工可提取價值)的損失。這使得順序器或區塊生産者在驗證之前讀取交易,并允許他們進行前置、後置或更改交易順序以獲得經濟利益。

許多創業公司正在利用零知識證明和多方計算技術,使得可以在鍊上存儲私密資料,同時符合安全規定。當加密貨币的法規更加明确時,這些技術将變得更加普遍。

3、醫療保健領域案例

美國的醫療保健系統正在轉向以價值為基礎的護理體系,保險支付與結果相關,而不是服務。這種變化需要提高提供者之間和提供者與付款方之間的資料合作。HIPAA的要求在曆史上使得這種資料合作變得困難。

改善提供者之間的資料合作可以為醫生提供詳細的患者病史和風險因素,為患者提供更好的護理。像PatientPing、HealthGorilla和Zus Health等初創公司通過共享資料并建立資料标準來改善提供者之間的協調護理。資料清潔室可以支援負責任的護理組織(ACOs或提供者團體)更好地共同處理醫療記錄。

支付方從能夠檢視整個護理過程中的患者資料中受益。通過與提供者合作,他們可以主動評估患者的風險得分。如果患者配備了遙測裝置(如可穿戴裝置),這些資料可以與現有的醫療記錄相疊加,以主動評估風險。有風險的患者可以在出現緊急情況之前得到幹預。

最後,這些技術可以幫助提高提供者與學術界或制藥公司等研究組織之間的資料合作。通過允許研究組織在資料清潔室中對真實世界資料進行模拟,提供者不必擔心資料被帶出系統。像Nference等組織從醫療提供者擷取資料,并以保護隐私的方式讓研究機構通路這些資料。

4、金融業案例

金融機構之間的資料合作可以幫助建立個人和企業的全面财務賬戶。這有助于建構更好的信用評分、識别洗錢行為以及擷取有關消費和收入習慣的其他見解。

大多數金融機構目前擁有使用者的所有個人檔案的副本,并将其存儲在自己的伺服器中。這存在風險,資料洩露可能會導緻個人資訊公開。可驗證憑據有可能改變這種架構,允許金融機構接受“信用價值”或“KYC”等代替存儲個人身份檔案的标記。

像SkyFlow等公司已經使得存儲敏感支付資訊變得更加容易,進而使電子商務參與者可以與多個支付網關合作,而不是被限制在一個網關(如Stripe)上。

04

美國目前隐私計算技術現狀

在隐私保護需求增加的背景下,最有可能從中受益和受損的公司是像谷歌這樣的大型科技公司,以及提供雲計算服務的供應商。是以,這些公司在隐私保護技術的各個領域都進行了大量的開發,建立了開源技術。在未來的幾年中,我們可以預期出現更多的初創企業,包括:

  • 針對特定行業建立定制解決方案,例如為個人身份資訊(PII)、醫療保健和金融應用建構的資料保險庫和資料淨房技術
  • 将學術研究轉化為商業原型的參與者

目前對這些技術進行投資的投資者包括英特爾資本、Snowflake以及Insight Partners等戰略投資者和金融投資者。根據CB Insights的資料,過去2.5年中與“隐私”相關的公司的總投資額超過了37億美元,涵蓋了開發或促進隐私技術采用的網際網路公司。

從各行業的投資和參與者來看,我們可以預期:

  • 短期内(2-3年),後量子密碼學将取得進展
  • 短期到中期内(3-4年),資料淨房和資料保險庫的應用将逐漸增加
  • 長期内(6-7年),分散式平台和資料保險庫将得到主流采用
基于橢圓曲線的混合加密方案(ECIES)

推動大規模應用的因素包括:

1.合規要求的增加:如果美國其他州效仿加利福尼亞的CCPA法案,資料保險庫将需要成為現代資料架構中的一個新層級

2.用例從合規和法規到資料協作解鎖價值的轉變:例如,Skyflow允許電子商務平台将卡資料存儲和處理在其資料保險庫中,解除了對支付網關的依賴

3.Defi、營銷和醫療保健方面的應用可能會創造一個大市場來推動采用

4.通過使用FPGA和ASIC進行算法和硬體加速的改進:與量子計算機免疫的密碼學技術密切相關的後量子密碼學是一個相鄰領域,将推動硬體加速技術的發展。ZK證明技術在擴充區塊鍊方面引起了很大的興趣,根據Crunchbase的資料,迄今為止已經有超過14億美元的風險投資投入。

05

結論

隐私對消費者、監管機構和企業的重要性越來越高。大型科技公司、學術界和初創企業的進展不斷推動通過新技術對私密資料進行計算。未來幾年,我們可以預期:

1.随着對資料洩露的擔憂加劇,差分隐私的采用将不斷增加。

2.在短期内,更嚴格的法規将繼續推動隐私計算技術的應用範圍。

3.品牌、醫療保健機構和金融機構将采用資料清潔室進行資料共享和協作。

4.随着加密貨币法規的明晰,DeFi和營銷方面的應用将提供價值,進而推動硬體加速技術的進展,并在長期内實作更廣泛的采用。

5.到2030年,資料隐私将成為現代資料管理架構中不可或缺的組成部分,就像安全性在今天的地位一樣重要。

本文由“開放隐私計算”翻譯整理,分享僅供學習參考,若有不當,請聯系我們處理!

繼續閱讀