天天看點

為什麼第三方資料報告總是不準?

一到年底,就有各種第三方資料報告釋出,呈現2018年網際網路行業的發展狀況,對2019年行業趨勢進行洞察,理論上來說,這樣的報告對于創業者、投資者、媒體都是重要的參考,也有利于企業了解行業和對手,對資料排名靠前的公司也是一種背書。

然而每一年我們都會發現,不同資料報告出入很大,給人感覺有些雲裡霧裡。不隻是年度報告,“第三方報告不準”,多年來一直困擾着網際網路行業,特别是網際網路企業。

為什麼第三方資料報告總是不準?

第三方報告不準

近日看到兩份Trustdata的報告,其中一些資料,就讓人費解。

在Trustdata1月10日釋出的《2018年12月移動網際網路全行業排行榜》中,12月TOP200 App排行榜前10分别是:微信、QQ、支付寶、百度、wifi萬能鑰匙、淘寶、騰訊視訊、抖音、愛奇藝和QQ浏覽器。

為什麼第三方資料報告總是不準?
不過在其15天後釋出的《2018年移動網際網路行業分析報告》中,2018年TOP20移動應用座次卻發生了變化,分别是:微信、支付寶、QQ、淘寶、百度、wifi萬能鑰匙、騰訊視訊、抖音、愛奇藝和QQ浏覽器。支付寶超過了QQ,淘寶超過了百度和wifi萬能鑰匙。
為什麼第三方資料報告總是不準?

會不會是第二份報告統計的是2018年全年資料?答案是否定的。Trustdata在報告中明确,采納的是2018年12月的資料,相關App的MAU也發生了變化,有的甚至直接增加了兩億之多。

不隻是資料前後有出入,關鍵名額與企業官方和其他第三方資料也不一樣。

騰訊2018年三季度财報顯示:QQ整體月活為8.026億,就移動端而言,QQ智能終端月活賬戶為6.979億。在Trustdata兩份報告中,QQ月活卻隻有5.8億,會不會是QQ四季度大幅下滑了2億?答案是否定的,三季度QQ智能終端月活躍賬戶同比增長6.9%,年齡21歲以下的年輕使用者活躍使用者數和使用時間甚至還錄得增長,不可能出現這樣的斷崖式下滑。

如果說企業官方公布的資料不具備權威性,我們可以再看看别的第三方資料。QuestMobile的《中國網際網路2018年度大報告》在行業内傳播最廣泛,它的App排行榜顯示,前十分别是:微信、QQ、支付寶、手機淘寶、愛奇藝、騰訊視訊、百度、抖音、搜狗輸入法和高德地圖,跟Trustdata有不少出入,其中QQ12月的MAU是6.49億,比TrustData的MAU多了近億,跟騰訊三季度财報的QQ智能終端月活6.979億非常接近。

我們再看手機資料。Trustdata第二份報告顯示,中國智能手機出貨量品牌占比,榮耀8.5%,小米12.6%,然而在賽諾的資料中,榮耀以5427萬台銷量超越蘋果(5270萬台)跻身中國市場TOP4,僅次于OPPO、vivo和華為。一份報告中,榮耀比小米強;另一份報告中,榮耀卻遠不如小米。

同一家資料機構釋出的不同報告,一個産品同一個時間的關鍵資料有巨大出入,确實很罕見。但不同報告中,一個産品的資料差異巨大的例子卻不勝枚舉。“第三個報告不準”的争議,已經成為企業和第三方資料機構間的公開沖突。

誤差太大企業不滿

在資料這件事情上,中國的資料機構與企業之間,以及企業與企業之間一直都處于這樣的狀态:一份報告出爐,某項名額第一、第二、第三之類的排序明确之後,企業要麼會質疑資料機構統計資料的方法、結果或者動機,要麼質疑競争對手與資料機構“合作”進而導緻資料不公平。

2016年張一鳴炮轟資料機構艾瑞就曾引發行業争議,艾瑞當時的資料顯示今日頭條日活使用者為“數百萬”,但今日頭條稱多家第三方資料機構報告中其日活躍使用者數都超過三千萬。

令人印象深刻的案例還有UC浏覽器和QQ浏覽器之間的“資料之争”,俞永福某次看到資料之後同樣表示震怒,拍桌子指責某資料機構和騰訊,并找一堆媒體去澄清自己才是移動浏覽器老大…這兩家關于誰是移動浏覽器“老大”的争奪,也持續了兩三年。

2016年高德與百度也一直在争論究竟誰是網際網路地圖老大,高德甚至不斷喊話表示希望通過“嵌入第三方代碼”的方式一比高下;2017年,Trustdata釋出《2017年上半年中國移動網際網路行業發展分析報告》中,關于“共享單車榜單易主,ofo登頂,摩拜呈現負增長”的結論,受到ofo質疑,ofo與摩拜單車也有很長一段時間在争,究竟誰是共享單車第一。

類似的争議發生在搜尋、電商、視訊、音樂、外賣諸多業務之中…如果一個領域沒有資料之争,隻有幾種可能:

  • 一是這個行業太小,資料機構報告都不屑于出;
  • 二是這個行業定局了,比如從來沒有誰敢和微信來争第一;
  • 三是這個行業不再景氣,共享單車、浏覽器,現在就不争了。

當然,隻要涉及到排坐次,就很難讓所有人滿意。如果說資料差距本身就很大,自然不會引發争議;如果說旗鼓相當,第三方資料機構往往難以厘清孰優孰劣,如果一定要厘清就會受到質疑。第三方資料機構就像球場上的裁判,有些球怎麼吹都會挨罵。

不過,深層次來看,各大資料機構總給人資料不準的感覺,還有更多原因。

為什麼報告會不準?

這一點羅超頻道在《今日頭條PK艾瑞:資料機構和企業為何總是争論不休?》一文中已有分析,今天看來很多原因依然沒有得到解決,一些問題得到了解決。

第一、資料機構的結果如何得來的本身不夠透明。

說某家公司市場佔有率這麼多,使用時長這麼多,是如何得出結論的?如果是抽樣調查,樣本選擇是否科學;如果是自動化工具,覆寫使用者是否足夠大,原始資料和資料統計過程是否有漏洞…這些都是企業可能會質疑的點,是以資料源來自哪裡,如何統計的,統計過程都要足夠透明,經得起第四方、第五方的檢驗才有說服力。

前些年第三方資料機構公布報告,可能連資料源、統計方法都不會公布。如果監督企業資料卻不公布自己的監督方法顯然是不公平的。今天靠譜一點的報告基本都會公布統計方法和資料來源,如果不公布這些的報告,看看就好了。

第二,資料樣本很難覆寫全量隻能部分反映。

最了解一個App真實資料的,隻有企業自己,第三方資料機構隻能通過各自的方法,擷取部分資料樣本,再應用統計學等方法去推測整體資料,是以第三方資料隻能不斷接近真實水準,卻不可能做到100%準确,資料擷取能力決定着一家機構資料接近真實情況的能力。

不同機構擷取資料方法不一。一些非主流資料機構直接采取抽樣,甚至去應用市場爬下載下傳量這樣的“笨方法”來做報告,基本已沒任何參考價值。主流資料機構也有不同辦法,有的跟手機公司直接合作,有的跟營運商合作,有的給App提供技術服務順便拿到一些資料,有的跟App合作,但不論哪種手段,都不能覆寫全部資料。

相對PC網站的開放性而言,移動時代資料統計更難,App是一個封閉的體系,它自己最清楚自己的資料,而且網際網路公司都将資料當成資産,愈發不願意公開資料給第三方,如果涉及到交易額之類的機密資料更是不可能公開。

正是因為此,第三方資料機構的資料,隻有一定參考性,就像前文提到的TrustData,其在報告中表示,資料基礎是自建的“日活超過1億,月活超過3.2億”的安卓使用者樣本集,再根據網民人口結構、地域分布、各移動應用iOS和安卓比例等因素建立模型計算所得,說白了還是統計學規則,既然是這樣,也隻能盡量準确,不能做到絕對準确。

為什麼第三方資料報告總是不準?

第三,就算能拿到樣本,誰能保證資料本身沒問題?

不論是手機公司還是營運商,給到第三方資料機構的資料都是原始,需要進行去重、清洗、脫敏等等,這就要考量一個資料機構的大資料挖掘能力。

在有能力處理拿到的資料後,還要對資料進行“脫水”,甚至“反刷”,舉個例子,如果一個第三方資料機構采取與App合作讓後者接入自家SDK的方式來統計後者資料,那麼企業會不會去“做資料”,來欺騙對應的資料機構?換句話說,如果資料機構讓企業自己“上報”資料,企業就會老老實實給資料嗎?不隻是這樣的情況,如果一個報告很重要,企業又知道報告統計方法,就很可能會想方設法去把資料做得漂亮,從資料源頭造假,這基本上無解。

第四、不同機構資料名額口徑嚴重不統一的問題。

前幾年網際網路公司合并的很多,經常出現合并之後兩家公司市場佔有率加起來大于100%甚至200%的情況…這是因為之前兩家公司可能找了不同的資料機構做報告,并且,這些報告采取了不同口徑:有的統計的是滲透率,有的是使用者市場佔有率,有的是活躍使用者份額…總之,五花八門的名額讓人眼花缭亂,精細化的統計并不是沒有必要,但很多時候資料機構是為了給企業做一份能夠拿到“第一”的報告而努力設計對應的名額和口徑,結果就是,A企業用數學去跟B企業比國文,大家根本就不是在對比同一個名額。

資料不準的原因是多方面的,長期來看,資料隻能盡量降低誤差,然而卻不能消除誤差。既然是這樣,是不是說,第三方資料報告沒價值呢?答案是否定的。

如何看待第三方報告?

首先,資料不說謊,真實的資料對于行業來說有很大的價值。

企業了解行業和對手,創業者尋找創新機會,投資者發現項目,媒體報道企業,都要看資料。企業自己公布的資料不一定就是真實的,正是因為此,需要第三方資料機構來作為參考。

是以,我們不能否認第三方資料機構存在的價值,以及各種第三方報告的價值。

正是因為每一家資料機構的報告都不是絕對準确,是以資料關注者應該綜合參考多家機構的資料。現在國内網際網路行業比較主流的就有QuesMobile、APP Annie、艾瑞、trustdata、talking data,超級大公司也有自己的資料監測平台,比如騰訊燈塔、百度移動統計、阿裡友盟等。

為什麼第三方資料報告總是不準?

其次,機構要自律,隻有盡量讓資料接近真實水準才能走得遠。

現在資料機構越來越多,如果你資料總是不靠譜,品牌沒了、資料就沒人信了,大家會選擇去相信有品牌的資料機構,QuestMobile就是最近兩年崛起的資料機構,不是因為資料100%準确,而是因為資料相對更加準确,口碑可以。

有一些機構資料不準也與商業模式有關系,是以資料機構要走出依賴報告本身的營收模式,而是探索類似于大資料服務、開發者服務、咨詢服務、資料媒體化等新的商業模式。現在有的機構的報告資料真正做到了絕對客觀,對資料本身敬畏,最終資料報告影響力就越來越大,是以每一次發報告,就可以成為品牌的廣告機會,進而形成商業模式。

為什麼第三方資料報告總是不準?

最後,機構要自強,拿到更多資料的同時強化大資料技術。

機構要合法合理地擷取更多真實有效的樣本資料,在移動時代特别是監管部門限制對使用者資料擷取後,這會越來越難,正是因為此,資料機構競争會更激烈。

去年成功IPO,成為第三方資料服務商第一股的極光大資料,就勝在了資料擷取能力上,其擁有開發者服務、廣告服務和資料服務三大産品體系,覆寫極光推送JPush、極光IM、極光短信、極光統計、社會化分享,廣告服務(極光效果通)助力實作精準營銷,基于此可以與很多手機廠商合作交換資料,跟App開發者(含iOS平台)進行合作來搜集資料,最終形成了較強的樣本資料覆寫。

為什麼第三方資料報告總是不準?

機構還要不斷強化自己的資料挖掘技術,應用日益成熟的AI、IoT等技術對資料進行廣泛擷取、深入洞察和價值挖掘,為行業創造價值。在我看來區塊鍊技術的普及,也有望解決企業與機構間資料共享的沖突,因為區塊鍊的一大優勢就是可以在保護隐私的同時進行資料分享應用。

大資料時代,我認為隻有在資料和技術上形成核心競争力的資料機構,才能走得更遠。

繼續閱讀