在Hadoop上运行C++项目的三种方式:Hadoop Streaming,Hadoop Pipes和最原始的JNI,哪种效率最高?还有个百度的HCE,据说效率比Streaming/Pipes高20%,也不知道真的假的?到底选择哪种方式最好呢?谢谢
http://jingyu.dyndns.org/~jzhou/research/publications/2013_aina.pdf 还真有个论文说这事
不过具体的性能要看你的场景,可以写一些单元测试验证一下