java-jstorm

2016-05-30 23:50:00

jstorm 是阿里巴巴开源的基于storm采用Java重写的一套分布式实时流计算框架，使用简单，特点如下：

开发非常迅速: 接口简单，容易上手，只要遵守Topology，Spout， Bolt的编程规范即可开发出一个扩展性极好的应用，底层rpc，worker之间冗余，数据分流之类的动作完全不用考虑。

扩展性极好:当一级处理单元速度，直接配置一下并发数，即可线性扩展性能

健壮:当worker失效或机器出现故障时，自动分配新的worker替换失效worker

数据准确性: 可以采用Acker机制，保证数据不丢失。如果对精度有更多一步要求，采用事务机制，保证数据准确。

优点：

Nimbus 实现HA

彻底解决Storm雪崩问题：底层RPC采用netty + disruptor保证发送速度和接受速度是匹配的

新增supervisor、Supervisor shutdown时、提交新任务，worker数不够时，均不自动触发任务rebalance

新topology不影响现有任务，新任务无需去抢占老任务的cpu，memory，disk和net

减少对ZK的访问量：去掉大量无用的watch；task的心跳时间延长一倍；Task心跳检测无需全ZK扫描

Worker 内部全流水线模式：Spout nextTuple和ack/fail运行在不同线程

性能：采用ZeroMq，比storm快30%；采用netty时，和storm快10%，并且稳定非常多

jstorm使用起来很简单，遵循Topology，Spout， Bolt的编程规范就可以，在下面的例子中将一步步完成这些。例子也很简单，在spout中不断产生自增的int数组，bolt接受到数值后打印出日志，并插入到hbase中。

参考另一篇博客

经过上面的三个步骤，一个最简单的jstorm应用就开发完成了，接下来通过编译、打包完后，生成jar文件 jstorm-hbase-demo-0.1.jar ，将此jar文件在jstorm集群的nimbus机器上提交即可： jstorm jar jstorm-hbase-demo-0.1.jar com.xirong.demo.BootStrap config.properties

java-jstorm

继续阅读

关于Gradle配置的小结

Java小案例——随机数猜测随机数猜测

nginx location中斜线的位置的重要性

27 Best Free Eclipse Plug-ins for Java Developer to be ProductiveCode Quality PluginsText Editor PluginsDependency ManagementVersion Control Integration PluginsFramework Development Continuous Integration Related PluginsOther Utility Plugins

Java String.format方法的简单使用

neo4j之cypher使用文档

GitHub连夜封杀！这份阿里 10W 字内部 Java 字面试手册到底有多强？

spark/scala关于【资源文件】加载方法概述外部文件加载方案测试资源文件打包入jar包中小结

mybatis_入门程序Mybatis入门

AOP编程_Android优雅权限框架(1)概念基础，2021金三银四前言正文大纲正文

Effective Java 8:通用程序设计

OOM三种类型

工厂模式-三种类型

【递归】高效率求2的n次幂

win10本地scala和spark安装安装scala安装spark

scala (3) Function 和 Method