天天看點

行為資料交易三定律

行為資料交易三定律

資料交易有什麼特點呢?劉鵬談了自己對于資料交易的認識,并總結為以下三定律:

行為資料交易三定律

l 第一定律,資料隻能交易,不能交換或者共享;

資料共享的事件似乎正在發生,各公司之間在互相的交換資料,希望能夠對彼此的業務産生一些貢獻。但事實上,結果隻有兩種:一種是線上上系統進行大規模資料 共享交換的案例,這種隻存在于有投資關系(即母公司和子公司控股關系)以後才會發生的資料交換,定價或者交易實際上發生在更高的資本之間。另一種,很多人 的交換或者共享,這種的結果往往不會有下文,大家隻是互相測一下資料對于雙方是否有用,測完就結束了。其實,資料在網際網路市場上變現很容易,這也是擁有大 量資料的巨頭公司不會共享資料的原因。即便百度這種大公司拿出一些資料進行共享,也隻是短時的貼補,主要用于刺激市場的流動性,但這短期是可行的,長期很 難形成規模。資料具有變現的價值,是以真正的共享是不存在的。唯一可共享的是政府資料,因為政府沒有盈利的需求,但如果無邊界的共享,也會成為一種災難,是以政府資料的共享可描述成一種政府的轉移支付。

行為資料交易三定律

l 第二定律,隻有按效果而非購買量付費,才有足夠的需求。

廣告的程式化交易過程中,adx在每一次impression(印象,放置廣告圖像的網頁每一次顯示,就是一次印象)都會向dsp發一次請求,是以每一個impression都會做廣告交易。對方想要什麼資料你就給他什麼資料。結算不根據資料結算,你給了對方一百萬個标簽,他就給你标簽的錢,而是根據最後赢得的廣告展示量(即資料最後實際産生的效果)付費。

廣告市場這樣做交易,規模才可以做得更大,因為它解決了購買部分資料和按照效果購買資料的問題。如果整體購買資料,資料交易市場會做不起來。網際網路所有的 産品,不管是廣告,還是将來的資料,一定是靠長尾的客戶,靠頭部的客戶。現今的解決方案隻适合廣告産業,其他的場景怎樣部分交易,怎樣按效果交易,需要結 合每一個場景讨論,全量交易沒有前景。

現今的資料交易所還很初級,它還未發現資料交易中購買需求方的問題。資料需求方要買一部分資料,如果給他全量資料,不僅大量資料用不上,還會給對方造成成本的增加。但在廣告交易裡,這個問題已經獲得解決。

行為資料交易三定律

l 第三定律,資料交易跟流量交易本質的不同在于,同一資料被越多的人使用價值越低。從流量看,一個廣告位投一次展示,隻能是一個人在用,而從資料看,知道這個人是男性,并告訴十個人,它的價值就自然地下降。

給資料定價是資料交易裡面最困難的一步。網際網路的廣告和傳統廣告不同,網際網路是通過拍賣的方式競價,定價權掌握在需求方,廣告主給要買的流量定價。廣告對于不同的廣告主,其價值不同,對甲方廣告主可能值1塊,但對乙方廣告主可能值2塊,這時廣告定價1塊或2塊都不合适,而競價可以解決資源的配置設定。資料最終也會走向競價的模式,但資料的交易和流量的交易卻有本質的差别,流量交易的量會受到限制,即一次就是一次,不可能兩個同時投放。而資料的一個标簽可以給十個人,現在的數字交易是不限量的,會發生資料的價格向流量價格的轉移。

現在的資料交易市場存在一個很大的問題,即資料本身的交易量很大,但價格偏低。這是由于沒有限制資料供給量,使得競價環境不能形成,是以擡高了流量價格, 低估了資料價格。但這個問題并不好解決,因為它會對前面的交易過程有深層次的影響和變化。隻有把限量供應和競價的問題解決掉,資料才能真正的合理定價。

未來的大資料行業,需要徹底解決資料交易的問題,資料交易市場才能爆發成長,因為一個沒有交易的商品,很難獲得大規模發展。

行為資料交易三定律

關于隐私,你肯定不希望自己的個人資料洩露給不相關的人。歐盟負責隐私保護條例制定委員會——a29協會,對于隐私給出了一些基本的原則,這些原則也是現在歐美網際網路公司的共識。基本原則包括:

pii(personal identifiable information)不能使用,如家庭位址、電話、名字等資訊。pii嚴格禁止使用,也不能變成标簽。

使用者可以要求系統停止記錄和使用自己的行為資料。

不能長期儲存和使用使用者的行為資料。以一年半為周期,資料超過一年半,備份也不允許,因為備份很可能會洩露出去。

實際碰到的隐私問題會更嚴重,比如朝陽區某個人xx歲,在xxx公司上班,如果對這個人較熟悉,對他有一定背景資訊的了解,如果沒有對這個人做任何的pii,就非常容易根據資訊把他定位出來,如果表格上面有這個人的月薪,該資訊就洩露了。

行為資料交易三定律

網際網路大資料真正嚴重的問題,其一是稀疏行為資料的新挑戰。這裡分享一個故事,netflix曾經有一個100萬美金的推薦大賽,給的是每個人的觀影記錄,讓大家給新的影片打分,并預測新影片是否會受歡迎。有個人參加了這個比賽,他看到了一條記錄,關于abc影片的觀影時間和評價,立刻反應出該記錄是由自己同僚産生,同時,他發現除了這些觀影記錄之外,記錄裡還有很多關于同志的電影。但該同僚并不想讓别人知道自己在看同志相關的影片,當這位同僚知道netflix公司洩露了自己的隐私後,将netflix告上了法庭。

是以,隐私的問題并不是指有人把使用者的資訊賣出,而是指熟人之間的隐私,即甲對乙有一定背景資訊的了解,同時甲正在不計成本地了解乙的隐私。

隐私是大資料頭上的達摩克裡斯之劍,隻是現在還未到爆發之時,大家也沒有技術手段去規避這種問題。很多科學家和數學家現在都在研究,怎樣在一個個性化的 系統裡和資料交易裡降低風險,但至今還沒有找到答案。但随着大資料産業的發展,我們有理由相信,資料交易裡未解決的定價和隐私問題,終有一天會得到很好的 解答。

本文作者:佚名

來源:51cto

繼續閱讀