天天看點

五大尴尬掣肘大資料

雲計算是大資料的運作平台,非結構化資料爆發式成長,大資料的智能分析和決策被粉飾的神乎其神,不過針對應用領域,還有四個要素将影響大資料發展:

1.預測後不敢用

如果把大資料比作算命顯然有點欺負了這位IT新寵,但從目前的大資料分析領域看,在很多行業應用上還存在敢測不敢用的尴尬,預測結果更多是印證而不是代替決策,除了大資料本身預測準确率以外,系統性風險帶來的決策失誤很可能最終讓大資料背鍋,資訊部門以及咨詢機構憑空擔了責任,想想就覺得冤枉。

2.資訊不對稱

大資料展現在一個大字上,是一個公司的資料還是一個行業的資料還是合縱連橫參考多個次元資料來做的最終分析?實際上各個“大資料庫”如一個個資訊孤島,彼此缺乏關聯,而單一通過某個孤島來決策自然生态顯然是盲人摸象,不準也就不足為奇了。

3.非結構化難解人性

結構化資料的最大特點是基于考量資料做推演,總結過去做預測,可目前大資料面臨太多的非結構化資料,這裡包含了龐雜的社會資訊和幹擾資訊,如果我們按照結構化資料的方式來看,從過去10年情況來預測今年的走勢,也許會得到一個波動不太大的結果,但如果我們發現某位使用者衣服買了綠色,褲子買了綠色,襯衫買了綠色,然後系統認為使用者在服飾選擇上偏愛綠色的話,那有一天使用者想買頂帽子時,系統推薦的商品也許會激怒使用者。

這應該是大資料面臨最尴尬的一點,如果說大資料是基礎,深度學習和人工智能才是關鍵,因為這兩項必須依靠大資料作為基石,會讓決策準确度實作指數級提升,當這兩項技術水準得到了解放,大資料才完整展現了價值。

4.使用過期資料

資料的新鮮程度将極大影響最後的分析結果,不同的行業的資料保鮮時間也會有很大差别,例如服裝業的潮流變化速度明顯快于其他行業,很多大資料最終結果偏差都是由于資料更新的不及時性導緻,是以如何確定資料不斷随時更新對于大資料來言是一個很大的挑戰。

5.走不出安全隐私困局

安全是一個永久話題,資料越多,洩露後帶來的風險和損失越大,“大資料庫”越大,一鍋端後看着越辣眼睛。

本文轉自d1net(轉載)