一般看到的解决方案
1文件缓存
问题 数据过大有瓶颈 本来hadoop就是处理大数据的
2转换map输出的key值
问题 数据需要合并结果 key修改后 无法合并原始相同key对应的val
3将倾斜的数据单独拿出来处理
问题 如果数据是动态的
请问你有什么简单有效的方法吗
微信里点“发现”,扫一下
二维码便可将本文分享至朋友圈。
http://blog.csdn.net/core_cto/article/details/8644692