Strom框架中的单词统计

2023-04-08 16:00:23

Strom框架中的单词统计

- - 34.Strom框架中的单词统计Topology定义如下，其中定义了两个Bolt，试述两个Bolt各自完成的功能，以及中间结果如何在两个Bolt之间传输
  - 35.在Strom的单词统计实例中，为何需要使用fieldsGrouping()方法保证相同单词发送到同一个任务上进行处理

34.Strom框架中的单词统计Topology定义如下，其中定义了两个Bolt，试述两个Bolt各自完成的功能，以及中间结果如何在两个Bolt之间传输

TopologyBuilder builder = new TopologyBuilder();
Builder.setSpout(“sentences”,new RandomSentenceSpout(),5);
builder.setBolt(“split”,new SolitSentence(),8)
    .shuffleGrouping(“sentences”);
builder.setBolt(“cout”,new WordCount(),12)
    .fieldsGrouping(“split”,new Fields(“word”));

第1个Bolt用于单词的分割没改Bolt中的任务随机接收Spout发送的句子，并从接收的句子中提取出单词；第2个Bolt接收第1个Bolt发送的Tuple并进行处理(Bolt是通过订阅Tuple的名称来接收相应的数据的，第1个Bolt声明其输出Stream的名称为”Split”，而第2个Bolt声明其订阅的Stream为”spilt”，因此第2个Bolt可以接收到第1个Bolt发送的Tuple)，即统计分割后的单词出现的次数。通过fieldsGrouping()方法，在”word”上具有相同字段值的所有Tuple(在本例中即单词相同的Tuple)将发送到同一个任务中进行统计，从而保证了统计的准确性。

35.在Strom的单词统计实例中，为何需要使用fieldsGrouping()方法保证相同单词发送到同一个任务上进行处理

FieldsGrouping：它保证相同field值的tuple会去同一个task，单词统计实例中必须保证相同的元素到同一个task,这时候必须用fieldsGrouping,否则统计出来的数据是不对的；

Strom框架中的单词统计

Strom框架中的单词统计

34.Strom框架中的单词统计Topology定义如下，其中定义了两个Bolt，试述两个Bolt各自完成的功能，以及中间结果如何在两个Bolt之间传输

35.在Strom的单词统计实例中，为何需要使用fieldsGrouping()方法保证相同单词发送到同一个任务上进行处理

继续阅读

jdk1.7+Eclipse+Maven3.5+Hadoop2.7.3构建hadoop项目

HDFS命令行工具

【51CTO学院三周年】自学路上的伴侣

在线教育巨头多邻国Duolingo入华一周年，中国市场马力全开

【分类算法】什么是分类算法定义分类与聚类分类过程方法

申请评分模型拒绝推断（RI）方法申请评分模型拒绝推断（RI）方法

Sql优化一：sql语句优化

Nacos 2.0 升级前后性能对比压测

尚硅谷—韩顺平—图解 Java设计模式（结构型）（55～）

Storm编译打包过程中遇到的一些问题及解决方法

MapReduce的几个企业级经典面试案例MapReduce的几个企业级经典面试案例

9.spark Core 进阶2--Cashe

浅谈企业活动中进行数据分析的重要性

Ambari介绍和架构原理

NOSQL安全攻击

win10本地scala和spark安装安装scala安装spark