天天看點

【好書試讀】大資料處理之道

【好書試讀】大資料處理之道

近年來,“大資料”已然成為it界如火如荼的詞,與“雲計算” 并駕齊驅,成為帶動it行業發展的兩列高速火車。尤其是在物聯網快速發展的時代,資料已經被稱為新的資源,是支撐物聯網發展的基石。

那麼,如何把“死”的資料變成真正有效的“資源”,成為近年來it界人士共同思考的問題。一時間,各種大資料處理技術如井噴一般湧現。hadoop、 spark、storm、dremel、drill等大資料解決方案争先恐後地展現出來。需要說明的是,這裡所有的方案并不是一種技術,而是數種甚至數十種技術的組合。就拿hadoop來說,hadoop隻是“領頭羊”,關鍵成員還有mapreduce、hdfs、hive、hbase、pig、zookeeper等,大有“八仙過海,各顯神通”的氣勢和場面。

本書首先橫向總結性地闡述了各種大資料處理技術,重點從緣起緣落、設計思想、架構原理等角度剖析了各種技術,分析了各種技術的優缺點和适用場景。本書并不涉及軟體的安裝等,因為如何安裝和使用,在網絡上搜尋即可,着實沒有必要浪費讀者的時間和金錢。在這一部分,第1篇為hadoop軍營;第2篇為spark星火燎原;第3篇講述了其他大資料處理技術,如storm、dremel、drill等。

其次闡述了大資料下的日志分析技術。在大資料時代,日志分析方案呈現出遍地開花的景象。如果将大資料處理系統比作一個可能得病的人,那麼日志分析就是負責看病的醫生,要想讓大資料處理系統健康、平穩地運作,日志分析和監控非常重要。這一部分重點闡述了日志分析技術中如日中天的方案elk。

最後展望了大資料處理技術的發展趨勢。大資料處理技術發展迅猛,資料量越來越大,技術的革新在所難免。

作為大資料研發人員,隻有時刻學習新技術,方能立于技術前沿。

繼續閱讀