天天看點

《智能資料時代:企業大資料戰略與實戰》一3.2 從小做起

本節書摘來自華章出版社《智能資料時代:企業大資料戰略與實戰》一書中的第3章,第3.2節,作者 talkingdata ,更多章節内容可以通路雲栖社群“華章計算機”公衆号檢視

在大資料分析過程中,我們應該找出微小但高價值的機會,并以這些機會為起點。在理想情況下,組織能夠通過完成這些較小的任務積累必要的專業知識,為将來進行大型的分析做好準備。鑒于作為分析目标的資料源和資訊類型會不斷擴充,同時相關公司會開始建立各種重要的分析模型以便更好地揭示結構化和非結構化資料的模式和這兩種資料之間的相關性,相關公司必須要關注的是,要根據其所闡明的業務目标,找出那些重要程度最高的調查結果。

必須要避免的情況是:你最終找到了一種可以确定新模式和資料關系的程式,但這些模式與關系對于業務流程卻沒有任何幫助。上述情況在分析矩陣中被稱為死區,即盡管你能夠發現新的模式,但這些模式與待解決的問題之間卻沒有聯系。

大資料項目的成功,往往始于極具針對性的目标和對量級較小的資料集的關注。隻有通過這種方法,才能在獲得項目成功後開發出真正有效的大資料分析方法,此類方法的初始量級不高,但它們會随着實踐成長。這種模式在實踐中的效果很好,因為企業能夠在為資料分析做準備的同時,以較少的初期投資創造價值。

為實作上述目标,我們可以從“微量資料”開始(即擷取單獨的資料流并将其遷移到不同的系統中,以便進行後續的融合處理)。随着時間的推移,微量資料會不斷地蓄積、增長并最終帶來大資料的誕生。擴充能力将至關重要:随着所收集資料的增加,系統的規模也需要不斷擴充以适應不斷增長的資料量。

繼續閱讀