有一个任务是串行任务,包括三个阶段1->2->3,其中1的输出是2的输入,2的输出是3的输入,这样串行的任务在hadoop下能并行运行吗?例如1阶段和2阶段并行运行,这应该是可以实现的,只要2阶段的输入已经完成就可以,但具体方案怎么实施呢?求大神解答,谢谢!!!
如果1->2->3算一条任务,你有很多这样的任务?
可以通过addDependingJob()添加依赖关系,详见园子里的博文:ChainMapper ,ChainReducer,多个Job串行
1、2、3是无法并行的,但是如果你有多组:
A:(1、2、3);
B:(1、2、3);
C:(1、2、3);
那么 A、B、C是可以并行的。