不提供实时查询,统计功能作为任务,提供导出详细;做备库,在备库查询
要分库么?
@WHº: 如楼下所说,可以用ES,是否需要分库,要看数据量,统计频率等综合分析,如果一天一次、一个月统计几次,完全没必要。
实时查询框架,当然是ES啦
Elasticsearch吗
@WHº: 是的,了解一下
@不知道风往哪儿吹: 我看看,需要同步数据到Elasticsearch上面么
@WHº: 它相当于一个分布式内存数据库,需要把你需要查询的数据同步上去
@不知道风往哪儿吹: 有没有什么api或者相对好点的教程呀,大佬
Hadoop、Spark?
会员重复的问题可以在程序中根据日期分组,再根据会员id分组