天天看點

都想搞個大資料 挖掘更多創造資料的管道更重要

現在大資料這個慨念已經快要“爛大街“了,無論什麼企業什麼行業都要嚷嚷兩句自己的業務有融入大資料,似乎有點流量就是大資料,有點資料就可以搞雲,搞人工智能。對于這件事,你怎麼看?

都想搞個大資料 挖掘更多創造資料的管道更重要

  大資料的未來

bernardo huberman 是全世界最早利用社會化資料進行大資料預測的科學家之一,他們普遍認為,未來大資料的核心叫“社會化大資料”,人和人的關系、人和資料的關系都要用資料關聯呈現。這就是為什麼在美國很多人認為谷歌的價值不如facebook。

都想搞個大資料 挖掘更多創造資料的管道更重要

通過對社會化資料的分析,我們能夠對人,社會和商業有更加深入的了解。這也是近期微軟為什麼以每股196美元,合計262億美元的全現金收購包括linkenin公司的全部股權和淨現金的原因。雖然linkedin使用者活躍度很低,但是從社會化資料的角度衡量,它的資料非常有價值。

大資料的壁壘

社會化資料有強大的壁壘,巧婦難為無米之炊,隻要掌握了資料,即使分析能力不那麼精緻,也能實作一些匪夷所思的事。社會化資料分兩類:一類是開放的,像facebook。一類是封閉的,像微信。微信互動資料積累的資訊和互相關系,除了騰訊,沒有人可以掌握,更别說使用。大資料的門檻非常非常高。

都想搞個大資料 挖掘更多創造資料的管道更重要

今天,大家都知道資料裡金子,是以大多數公司會采取相對封閉的辦法。雖然今天的掘金能力不強,但是守着這座金礦,不許别人來挖。這種心态會阻礙行業發展,最優秀的專家未必有機會獲得資料進行分析處理。資料壟斷的問題在未來更加嚴重。

無奈的現實

美國著名企業家、發明家、《奇點臨近》作者庫茲韋爾,為了利用谷歌公司的資料研究人工智能,不得不加入谷歌公司。許多公司利用手機app和浏覽器裡的cookie擷取大量使用者資訊,持續跟蹤使用者行為,但這明顯是對使用者資料隐私的侵權。

都想搞個大資料 挖掘更多創造資料的管道更重要

對過度要求使用者資訊擷取權限的行為進行監管是早晚的事,甚至下一代浏覽器不再支援cookie,不允許第三方對使用者行為進行沒有底線的跟蹤。無奈的是,如果不采用這種方法擷取資料,資料就會被大公司壟斷,小公司則沒有出路。資料整合也因大公司的市場比過高而困難重重。

都想搞個大資料 挖掘更多創造資料的管道更重要

比如說市場上的talkingdata,它會去整合和分析各家小公司的資料。你會發現一個規律,小公司的資料更容易拿出來共享,越大的公司越不容易拿出來共享。小網站一定願意和你共享資料,但百度一定不願意,小app願意和你共享資料,但微信一定不願意。

都想搞個大資料 挖掘更多創造資料的管道更重要

實際上大公司的資料占據了市場的60%甚至70%以上的份額,這也就是大頭理論,頭決定了行業的走向,這些大公司的資料更加真實可靠,而長尾資料隻能淪為對市場了解的偏差,或者被大公司收購的命運。是以很多中小公司,都是靠從大平台配置設定和購買資料流量,來支援自有業務的成長。大平台可以做到非常大的資料流量倉庫,但是岔路口怎麼管理?這是提出的新學問。

可能的路徑

自己生産資料。資料生産方式已經多樣化,通過第三方采集+自己分析,有很強的優勢。比如美國一家公司,通過一個小衛星,專業監測超市門口車的數量,對車的數量漲落,判斷宏觀經濟是不是出現問題。同時在微觀方面,對超市競争對手做各種分析。

都想搞個大資料 挖掘更多創造資料的管道更重要

再比如一個精準種植公司,通過對水質和土質的監測,來指導農民非均勻的播種種植。這些都是一些個性化的資料挖掘和服務。把資料采集和分析結合起來,給使用者提供完整解決方案。個性化服務是未來大資料公司真正的競争優勢。

都想搞個大資料 挖掘更多創造資料的管道更重要

  最後

大資料很精彩,有能力卻沒有資料,未必能創業。挖掘更多創造資料的管道,利用資料的方法,最關鍵的是找到資料和應用的結合點。

====================================分割線================================

本文轉自d1net(轉載)

繼續閱讀