天天看点

storm学习笔记之一:storm 入门原理介绍

问题导读:

1.hadoop有master与slave,Storm与之对应的节点是什么?

2.Storm控制节点上面运行一个后台程序被称之为什么?

3.Supervisor的作用是什么?

4.Topology与Worker之间的关系是什么?

5.Nimbus和Supervisor之间的所有协调工作有master来完成,还是Zookeeper集群完成?

6.storm稳定的原因是什么?

7.如何运行Topology?

strom jar all-your-code.jar backtype.storm.MyTopology arg1 arg2

8.spout是什么?

9.bolt是什么?

10.Topology由两部分组成?

11.stream grouping有几种?

storm学习笔记之一:storm 入门原理介绍

Storm是一个分布式的、高容错的实时计算系统。

Storm对于实时计算的的意义相当于Hadoop对于批处理的意义。Hadoop为我们提供了Map和Reduce原语,使我们对数据进行批处理变的非常的简单和优美。同样,Storm也对数据的实时计算提供了简单Spout和Bolt原语。

Storm适用的场景:

1、流数据处理:Storm可以用来用来处理源源不断的消息,并将处理之后的结果保存到持久化介质中。

2、分布式RPC:由于Storm的处理组件都是分布式的,而且处理延迟都极低,所以可以Storm可以做为一个通用的分布式RPC框架来使用。