天天看點

隐私計算的下一站:資料應用啟航

作者:郭嘉日記

隐私計算技術包括聯邦學習、多方安全計算、匿蹤查詢、可信執行環境等,這些技術被封裝成各種軟體平台,通過招投标的方式,賣給大資料交易中心、營運商、銀行保險、醫療機構等。這是過去三年隐私計算行業的主要經營模式。

回頭來看,這個技術的初衷是什麼呢?我想一定是走到資料應用。作為隐私計算的技術供應商,如果以盈利作為一個目标,單純靠賣技術軟體,很可能就像區塊鍊技術供應商一樣,真正賺錢的反而是基于這項技術做數字貨币的企業、做征信區塊鍊的企業、做司法存證的企業 ……

回歸技術的初衷,下一階段也許更堅定的目标是做好基于隐私計算技術的上層資料業務應用服務。否則,費老半天勁兒搞這技術是為了什麼呢?

隐私計算的下一站:資料應用啟航

資料業務銷售的抓手

需要弄清楚場景方為什麼用隐私計算技術來做?(對業務的價值導向)

  • 合規驅動:
    • 聯邦學習:雙方在隐私資料不出私域的安全前提下,完成業務模型訓練。vs 傳統方式需要出庫
    • 安全求交:雙方在非共有的ID不互相暴露的安全前提下,完成使用者集合的求交和去重。vs 傳統方式會被撞庫
    • 匿蹤查詢:被查詢方無法知曉查詢方的ID,完成API調用。vs 傳統方式會被緩存
  • 價值驅動:
    • 分類分級:通過隐私計算可以使用的資料次元更多、顆粒度更細,模型效果更好
隐私計算的下一站:資料應用啟航

資料業務的商業模式

  • 左邊是中介分潤模式,比如資料源A和場景端B用了你的聯邦學習軟體,他們願意在資料交換的業務上給廠商C一個分潤比例。
  • 右邊是資料産品模式,比如廠商C用了聯邦學習技術,融合了資料源A1、A2的資料,做了一款資料産品P,賣給了場景端B。
【思考】
1)如果A到B這種中介分潤模式,是一個很大的市場,随着隐私計算技術越來越普及(比如像今天的資料庫技術、雲計算技術那樣簡單易用),那這個資料業務的生意憑什麼長久地給到科技公司?除非A和B非C不可。【現階段各家廠商普遍在做的是第一種。】
2)如果是A1+A2,注入廠商C的KnowHow,這個出來的資料産品P,是存在壁壘的,如何處理好最終使用者的完整授權鍊路,還有資料産品背後的模型調用路徑?           
隐私計算的下一站:資料應用啟航

資料業務的方向

網際網路時代,自從有了大資料應用,似乎可以總結大資料業務的兩方面的核心價值:“抓壞人”和“找好人”,大多數的B2BC模式的資料業務,都圍繞着“人”在做文章。今天的痛點和困境,是能合法合規地合作多源資料,讓“抓壞人”和“找好人”這兩件事情,做的更加精準。

“找好人”和“抓壞人”,從人群分布圖上,其實我們做機器學習大資料模組化的目的,就是試圖通過人次元的大量特征,把最左端和最右端的人群識别出來。

隐私計算的下一站:資料應用啟航

1)“抓壞人”

什麼是“抓壞人”?比如:

銀行機構需要識别辦卡用于詐騙的人;

信貸機構需要識别騙貸或者貸款還不起的人;

保險機構需要識别騙保的人;

地方政府需要識别偷稅漏稅的企業;

監管機構需要識别洗錢的交易;

……

這些機構對資料的長期需求是确定的,隻要是合規、有用。通過隐私計算如果能幫助其接入更豐富的資料資源,來提高模型識别目标使用者的精準度,那對于這些機構來說是引入“軟體+資料”最好的方式。

隐私計算的下一站:資料應用啟航

2)“找好人”

同理,什麼是“找好人”?比如:

金融機構需要識别高價值的頭部客戶;

營銷機構需要識别沉默使用者的可召回目标客群;

廣告媒體需要協助廣告主提高投放的響應率;

汽車主機廠需要從海量的客戶線索中識别最高購買意向使用者并引導到店試駕;

供應鍊金融中需要識别上下遊經營狀況良好的企業;

……

資料業務的産品形态

毋庸置疑,因為隐私計算技術,讓多源資料的合規融合成為可能。隻不過,技術隻能解決關鍵性難題、是一套解決方案,還不能構成所謂的業務、更何況是一款解決行業應用的産品。有一個衡量名額,如果你的産品能讓一個普通的銷售跑到業務部門直接賣掉,那就到位了。

資料業務的形态,通常是資料接口(API)、基于大資料的應用平台、或者就是基于資料的營運,難度、成本和風險也依次遞增。

1)資料接口

  • 脫敏标簽接口

這類資料産品沒什麼特别的技術含量,但是産品描述簡單、賺錢效應短平快,核心能力是它有你需要的資料次元,越獨特越好賣。比如社保公積金的資料、學曆的資料等等。

如果非要加上隐私計算技術,如果服務方是最終資料源,可以加一個匿蹤查詢,來提高一下查詢的ID安全性。

  • 資訊核驗接口

同上,資料本身價值導向,比如駕駛證核驗、三要素核驗、銀行卡二要素核驗等等。

同樣,如果非要加上隐私計算技術,如果服務方是最終資料源,可以加一個匿蹤查詢,來提高一下查詢的ID安全性。

  • 聯合模組化評分接口
  • 這是過去很長一段時間資料合作的主流方式,聯合模組化,最終調用輸出的不是字段明細,而是模型計算後的評分結果。比如:
    • 高淨值評分,用于刻畫評估使用者的資産水準等級,服務于理财、VIP服務場景等。
    • 信用評分,用于評估信貸場景的貸前、貸中等環節使用者的資信水準,服務于個人信用貸款、小微企業貸款等。
    • 信用卡營銷興趣評分,用于識别信用卡的潛客,服務于信用卡場景的獲客和休眠使用者精準召回等。
    • 汽車營銷興趣評分,用于判斷使用者的汽車購買意向和購買能力,服務于主機廠的汽車營銷和銷售線索評級等。
    • 保險反欺詐評分,用于識别騙保,服務于保險公司在客戶理賠環節的騙保行為。
    • 電信詐騙評分,用于識别電信詐騙的賬戶和交易,服務于銀行等機構在開卡和支付環節的電信詐騙行為。

2)應用平台

  • 資料交易平台

像北上深這種數交所、像各地的大資料交易中心,其實都有資料交易的政府牽頭場景,目的就是資料可以像大豆一樣在場内進行交易。資料交易平台,其實可以歸類為項目,而不是資料業務。為什麼擺在這裡提一嘴,因為資料交易平台關注的幾個細節,對資料業務有指導意義,比如如何保障資料安全、如何做交易的智能合約等等。

隐私計算的下一站:資料應用啟航

還有很多垂直于場景的業務平台,比如私域聯合營運平台(翻公衆号有一篇關于私域營銷的内容)、精準營銷平台、企業稅務監控預警平台、電信詐騙監控預警平台 …… 這類産品直接面向業務口,而不是面向科技部:底層技術先進,上層配套完整。

3)業務營運

  • 廣告投放代營運

這可能是最合适去做的隐私計算業務之一,如果作為一個技術真的能讓模型更好,那麼投放效率和ROI就會更好,那麼,作為廣告主,是很歡迎你幫他代營運來投放的。我們拿信用卡來說事兒:

銀行自己去頭條上投放,獲客成本可能在300元;如果你作為隐私計算供應商,你用了支付類的資料聯合頭條進行聯合模組化,獲客成本降低到250元。這就是能力!

如果用了聯邦學習模組化,用了各種資料,最終獲客成本還是300元,那麼隐私計算對于客戶來說,就是雞肋。

“如果說,合規監管,開啟了行業之門;

那麼,業務效果,決定了行業出路!”

你覺得是這麼回事兒嗎?還是說你做技術就是為了理想、為了報效時代的技術革命?

資料業務的合規假設

不管什麼資料業務、什麼産品形态,唯一繞不過去的共性問題是“使用者授權”,如果資料産品的所有權在資料源,那麼使用方和供給方都很容易給出使用者授權協定和授權主體。是以,如果你是一家資料源機構,資料産品的合規鍊路會更明白一些。

如果是一個科技公司,接了某個營運商的資料資源,出了一個聯合模組化評分的服務,這事兒要追根究底,就很難講清楚合規性。最根本的反駁是:“張三并沒有授權這家科技公司使用自己的個人資訊”。

這麼多年,我覺得吧,直接的資料API産品,這本來就是使用者直接授權的第一手資料源企業的生意。

繼續閱讀