1.你们公司的集群规模?
2.你们这个日志系统的业务数据有多大,有多少行?
3.你们提交的job任务大概有多少个?这些job执行完大概用多少时间?
4.你的项目提交到job的时候数据量有多大?
不知道怎么回答,请求大家建议?
你都没见过hadoop, 你面试什么……想虚构吗?
没做过项目,自己包装了一个,不知道怎么回答
1、集群规模150台
2、每天原始数据2T,约30亿行,清洗聚合入库总数据大小为8个T
3、每天提交的job数据量大概有300多个,平均每个job耗时10分钟,个别约15
4、聚合清洗后的数据提交到job的时候数据量一般为几个G-到几十个G,亿条数据量
这是什么网站,一天数据量也这么大
@东风带月: 是移动无限网络这块的数据
@Sadrm:你能指导指导我,面试项目怎么说吗