天天看点

Java多线程编程简明教程(2) - ForkJoin模式

说起fork-join模式,我们不免联想起了map-reduce.它们的原理都是分治法,就是将一个大问题划分成若干个小问题,如果这些小问题之间互相不影响的话,就可以并发去执行. 最后,统一将各小问题的结果汇总起来,就是这个大问题的结果.

这个任务最适合处理像一棵树一样的问题.

fork-join模式不再是只管一个后台作务,而是有多个任务并发执行. 这时我们前面学到的简单的线程池执行器的功能就显得不足了.这时候jdk 7开始为我们提供了forkjoinpool.

forkjoinpool不但自动计算开多大的线程池合适,而且提供了称为工作窃取算法的算法来管理这些任务. 如果有的线程空闲, forkjoinpool会从其它线程的队列尾中窃取一个任务给空闲线程来运行.而正常的线程是从任务队列头中取任务,二者不会有冲突.

如同futuretask一样,fork-join模式也有自己的task类forkjointask. 不过一般我们都是从forkjointask的子类recursivetask来继承. 通过重载recursivetask类的compute方法,来实现fork-join的逻辑.

在compute方法里, 要实现两件事, 顾名思义, fork-join就是要先fork出recursivetask对象的子任务,然后将它们join在一起.

我们先写个copy二叉树结构的简单任务学习一下如何利用fork-join框架来实现功能.

先实现一个最简单的二叉树节点,带左右孩子,一个字符串吧:

然后实现一个recursivetask的子类,重载它的compute方法.

下面我们开始实现分叉, 对于左右子树分别fork出一个子任务. 这两个子任务又会分叉出它的的子任务,直至结束.

fork之后, 任务就在后台开始运行了. 这时候我们开始构造我们的左右子树的父节点:

实际问题中一般不会这么简单.主线任务完成了之后,就是等待子任务交活儿,将它们组装在一起:

核心功能实现完了,下面我们写个主函数让它运行起来吧. 先构造一个被复制的对象.

下面我们前面介绍的主角之一 - forkjoinpool粉墨登场. 没什么复杂的设置,直接new一个就好:

forkjoinpool有了之后, 再创建一个我们的recursivetask的对象, 然后调用forkjoinpool的submit方法将其提交, 这又是一个future模式了. 最后我们通过这个futuretask的get方法获取结果就一切ok了.

整理一下上面的步骤:

实现一个recursivetask的子类,重载compute方法实现fork-join逻辑

合理划分任务,调用递归的recursivetask子类,fork出每个子任务

通过join方法获取子任务的值,并将它们组合到一起

构造forkjoinpool线程池

创建第一步的子类的对象,通过future模式,提交到forkjoinpool线程中运行

获取future的值,即可得到fork-join的结果.

总结一下,把刚才拆散的代码整合在一起:

现在这个阶段,暂时先不要共享内存,通过复制成不变的对象传递给子任务.返回值也创建新对象,当然可以使用对象池等技术.

暂时不要使用跨任务的容器,我们还没有经过相关的训练,时机还不成熟.

暂时不要使用其他的同步机制,我们的知识储备暂时还不够.

要注意任务中的异常会接收不到,一定在任务中处理好可能出现的异常. 否则发生了异常,在主任务中却收不到,会感到很奇怪.

注意i/o操作,建议目前阶段在fork-join之前将i/o操作提前做好.

尽管有一些限制,但是fork-join框架还是给我们带来了很大的便利. 按照fork-join设计好的代码,在将来计算核数增加时,会自动给我们的代码获得性能提高.

在结束这个快餐教程之前,我们得再次强调一下内存共享的风险. 请初学的同学们一定要重视起来.目前我们还没有学习java对象模型和容器的安全用法, 所以目前阶段最安全的就是不共享任何状态.

只读的对象是不会引起线程安全问题的.我们所有的跨任务的数据传递,暂时都只传递不变的对象.

这样的限制可能会带来一些不便和一些性能损失.但是,它是线程安全的,对于开发人员是种投入小见效快的好事情. 如果暂时还不能满意你的需求,我们会继续学习,从此开始,没有快餐式的速成教程了,我们要经过一段非常扎实的训练.

请大家注意,java中的fork-join并没有办法处理android的ui线程等问题, 如果需要运行在ui线程, 区分主线程和工作线程等, 还请参考上节我们分析asynctask中的做法, 该使用handler的还是要用handler. 后面我们还会详情说细节.