首页 新闻 会员 周边

hadoop面试问题

0
悬赏园豆:100 [已关闭问题] 关闭于 2016-06-24 15:10

1.你们公司的集群规模?

2.你们这个日志系统的业务数据有多大,有多少行?

3.你们提交的job任务大概有多少个?这些job执行完大概用多少时间?

4.你的项目提交到job的时候数据量有多大?

不知道怎么回答,请求大家建议?

testewr的主页 testewr | 初学一级 | 园豆:3
提问于:2015-05-09 08:23
< >
分享
所有回答(2)
0

你都没见过hadoop, 你面试什么……想虚构吗?

问天何必 | 园豆:3311 (老鸟四级) | 2015-05-09 09:22

没做过项目,自己包装了一个,不知道怎么回答

支持(0) 反对(0) testewr | 园豆:3 (初学一级) | 2015-05-09 10:37
0

1、集群规模150台

2、每天原始数据2T,约30亿行,清洗聚合入库总数据大小为8个T

3、每天提交的job数据量大概有300多个,平均每个job耗时10分钟,个别约15

4、聚合清洗后的数据提交到job的时候数据量一般为几个G-到几十个G,亿条数据量

Sadrm | 园豆:164 (初学一级) | 2015-05-09 11:57

这是什么网站,一天数据量也这么大

支持(0) 反对(0) testewr | 园豆:3 (初学一级) | 2015-05-10 22:52

@东风带月: 是移动无限网络这块的数据

支持(0) 反对(0) Sadrm | 园豆:164 (初学一级) | 2015-05-11 19:06

@Sadrm:你能指导指导我,面试项目怎么说吗

支持(0) 反对(0) testewr | 园豆:3 (初学一级) | 2015-05-11 19:30
清除回答草稿
   您需要登录以后才能回答,未注册用户请先注册