一般看到的解决方案
1文件缓存
问题 数据过大有瓶颈 本来hadoop就是处理大数据的
2转换map输出的key值
问题 数据需要合并结果 key修改后 无法合并原始相同key对应的val
3将倾斜的数据单独拿出来处理
问题 如果数据是动态的
请问你有什么简单有效的方法吗
http://blog.csdn.net/core_cto/article/details/8644692