天天看點

storm學習筆記之一:storm 入門原理介紹

問題導讀:

1.hadoop有master與slave,Storm與之對應的節點是什麼?

2.Storm控制節點上面運作一個背景程式被稱之為什麼?

3.Supervisor的作用是什麼?

4.Topology與Worker之間的關系是什麼?

5.Nimbus和Supervisor之間的所有協調工作有master來完成,還是Zookeeper叢集完成?

6.storm穩定的原因是什麼?

7.如何運作Topology?

strom jar all-your-code.jar backtype.storm.MyTopology arg1 arg2

8.spout是什麼?

9.bolt是什麼?

10.Topology由兩部分組成?

11.stream grouping有幾種?

storm學習筆記之一:storm 入門原理介紹

Storm是一個分布式的、高容錯的實時計算系統。

Storm對于實時計算的的意義相當于Hadoop對于批處理的意義。Hadoop為我們提供了Map和Reduce原語,使我們對資料進行批處理變的非常的簡單和優美。同樣,Storm也對資料的實時計算提供了簡單Spout和Bolt原語。

Storm适用的場景:

1、流資料處理:Storm可以用來用來處理源源不斷的消息,并将處理之後的結果儲存到持久化媒體中。

2、分布式RPC:由于Storm的處理元件都是分布式的,而且處理延遲都極低,是以可以Storm可以做為一個通用的分布式RPC架構來使用。