首页 新闻 会员 周边 捐助

十几亿条数据的匹配查询,应该用什么存储

0
悬赏园豆:60 [已关闭问题] 解决于 2014-11-11 10:21

应用场景是这样的,有几十亿条数据,每条数据包含几个字段(id,mail,content,userNum..). 一般的操作是 用查询词匹配查询这些数据(,每个字段都模糊匹配),找到匹配的数据返回。   线下分析之用,  延迟能接受即可。

qwer075的主页 qwer075 | 初学一级 | 园豆:127
提问于:2014-11-10 10:23
< >
分享
其他回答(2)
0

你可以看看NOSQL系列。诸如Mongo、Cassandra等。

幻天芒 | 园豆:37207 (高人七级) | 2014-11-10 10:57

这两个库有什么特点能简单说下么?

支持(0) 反对(0) qwer075 | 园豆:127 (初学一级) | 2014-11-10 11:17

@qwer075: 

http://baike.baidu.com/subview/3385614/9338180.htm?fr=aladdin

http://baike.baidu.com/view/1350234.htm?fr=aladdin

支持(0) 反对(0) 幻天芒 | 园豆:37207 (高人七级) | 2014-11-10 11:20
0

JQuery Autocomplete

msikruby | 园豆:136 (初学一级) | 2014-11-10 13:51

???

支持(0) 反对(0) qwer075 | 园豆:127 (初学一级) | 2014-11-10 16:51
0

一般来说大数据都是用nosql来储存,但是nosql都比较吃内存,如果内存够就转存到nosql里,内存不够,就分库,分表,分批次进行查询然后导出到一个新表中,获取了数据删除表即可

收获园豆:10
有色白水 | 园豆:212 (菜鸟二级) | 2014-11-10 20:42
清除回答草稿
   您需要登录以后才能回答,未注册用户请先注册