天天看點

《智能資料時代:企業大資料戰略與實戰》一3.3 關注大局

本節書摘來自華章出版社《智能資料時代:企業大資料戰略與實戰》一書中的第3章,第3.3節,作者 talkingdata ,更多章節内容可以通路雲栖社群“華章計算機”公衆号檢視

利用開源hadoop技術和新興的打包分析工具,能夠使經過sql教育訓練的商業分析員更加了解開源的環境。最終,在繪制大資料分析路線圖時,規模将成為最主要的影響要素。商業分析師将需要規避sql方法,才能掌握在節點和叢集上運作的分布式平台的概念。

此時,至關重要的是思考潛在資訊積累的形态。要做到這一點,我們可以先計算出從現在起的6個月内需要收集多少資料,然後确定需要多少台伺服器才能處理這些資料。此外,我們還必須確定使用的軟體能夠滿足資料擴充的需要。此時,有人可能會忽視解決方案的潛在成長能力以及将此類方案投入使用後的潛在受歡迎程度,但這種想法屬于嚴重的誤解。

随着分析尺度的擴充,資料管理的重要性也将不斷提升,在這一點上,大資料與任何其他大規模網絡運算并沒有什麼差別。資訊管理實踐也是如此,作為曾經在資料倉庫領域的關鍵要素,該實踐對于如今的大資料也同樣重要。我們必須要記住的是,資訊是一種企業資産,我們必須将其視為企業資産加以對待。