都想搞個大資料挖掘更多創造資料的管道更重要

現在大資料這個慨念已經快要“爛大街“了，無論什麼企業什麼行業都要嚷嚷兩句自己的業務有融入大資料，似乎有點流量就是大資料，有點資料就可以搞雲，搞人工智能。對于這件事，你怎麼看？

　　大資料的未來

bernardo huberman 是全世界最早利用社會化資料進行大資料預測的科學家之一，他們普遍認為，未來大資料的核心叫“社會化大資料”，人和人的關系、人和資料的關系都要用資料關聯呈現。這就是為什麼在美國很多人認為谷歌的價值不如facebook。

通過對社會化資料的分析，我們能夠對人，社會和商業有更加深入的了解。這也是近期微軟為什麼以每股196美元，合計262億美元的全現金收購包括linkenin公司的全部股權和淨現金的原因。雖然linkedin使用者活躍度很低，但是從社會化資料的角度衡量，它的資料非常有價值。

大資料的壁壘

社會化資料有強大的壁壘，巧婦難為無米之炊，隻要掌握了資料，即使分析能力不那麼精緻，也能實作一些匪夷所思的事。社會化資料分兩類：一類是開放的，像facebook。一類是封閉的，像微信。微信互動資料積累的資訊和互相關系，除了騰訊，沒有人可以掌握，更别說使用。大資料的門檻非常非常高。

今天，大家都知道資料裡金子，是以大多數公司會采取相對封閉的辦法。雖然今天的掘金能力不強，但是守着這座金礦，不許别人來挖。這種心态會阻礙行業發展，最優秀的專家未必有機會獲得資料進行分析處理。資料壟斷的問題在未來更加嚴重。

無奈的現實

美國著名企業家、發明家、《奇點臨近》作者庫茲韋爾，為了利用谷歌公司的資料研究人工智能，不得不加入谷歌公司。許多公司利用手機app和浏覽器裡的cookie擷取大量使用者資訊，持續跟蹤使用者行為，但這明顯是對使用者資料隐私的侵權。

對過度要求使用者資訊擷取權限的行為進行監管是早晚的事，甚至下一代浏覽器不再支援cookie，不允許第三方對使用者行為進行沒有底線的跟蹤。無奈的是，如果不采用這種方法擷取資料，資料就會被大公司壟斷，小公司則沒有出路。資料整合也因大公司的市場比過高而困難重重。

比如說市場上的talkingdata，它會去整合和分析各家小公司的資料。你會發現一個規律，小公司的資料更容易拿出來共享，越大的公司越不容易拿出來共享。小網站一定願意和你共享資料，但百度一定不願意，小app願意和你共享資料，但微信一定不願意。

實際上大公司的資料占據了市場的60%甚至70%以上的份額，這也就是大頭理論，頭決定了行業的走向，這些大公司的資料更加真實可靠，而長尾資料隻能淪為對市場了解的偏差，或者被大公司收購的命運。是以很多中小公司，都是靠從大平台配置設定和購買資料流量，來支援自有業務的成長。大平台可以做到非常大的資料流量倉庫，但是岔路口怎麼管理？這是提出的新學問。

可能的路徑

自己生産資料。資料生産方式已經多樣化，通過第三方采集+自己分析，有很強的優勢。比如美國一家公司，通過一個小衛星，專業監測超市門口車的數量，對車的數量漲落，判斷宏觀經濟是不是出現問題。同時在微觀方面，對超市競争對手做各種分析。

再比如一個精準種植公司，通過對水質和土質的監測，來指導農民非均勻的播種種植。這些都是一些個性化的資料挖掘和服務。把資料采集和分析結合起來，給使用者提供完整解決方案。個性化服務是未來大資料公司真正的競争優勢。

　　最後

大資料很精彩，有能力卻沒有資料，未必能創業。挖掘更多創造資料的管道，利用資料的方法，最關鍵的是找到資料和應用的結合點。

====================================分割線================================

本文轉自d1net（轉載）

都想搞個大資料挖掘更多創造資料的管道更重要

繼續閱讀

疾病研究：重症肌無力

Nacos 2.0 更新前後性能對比壓測

人工智能如何有效地運用于自然語言處理

尚矽谷—韓順平—圖解 Java設計模式（結構型）（55～）

Storm編譯打包過程中遇到的一些問題及解決方法

新聞 | Mapbox 牽手阿裡，飛豬旅行上線六大城市地圖功能

MapReduce的幾個企業級經典面試案例MapReduce的幾個企業級經典面試案例

[HTML5]自定義屬性 data-* 和 jQuery.data 詳解

9.spark Core 進階2--Cashe

2021-2025年中國運動療法（KT）帶行業市場供需與戰略研究報告

2021年危險化學品經營機關安全管理人員考試題庫及危險化學品經營機關安全管理人員考試技巧

淺談企業活動中進行資料分析的重要性

無人機--飛控科普

Ambari介紹和架構原理

NOSQL安全攻擊

win10本地scala和spark安裝安裝scala安裝spark

都想搞個大資料 挖掘更多創造資料的管道更重要

繼續閱讀

都想搞個大資料挖掘更多創造資料的管道更重要