十几亿条数据的匹配查询,应该用什么存储

悬赏园豆：60 [已关闭问题] 解决于 2014-11-11 10:21

应用场景是这样的,有几十亿条数据,每条数据包含几个字段(id,mail,content,userNum..). 一般的操作是用查询词匹配查询这些数据（，每个字段都模糊匹配），找到匹配的数据返回。线下分析之用，延迟能接受即可。

qwer075 | 初学一级 | 园豆：127
提问于：2014-11-10 10:23

< >

其他回答(2)

你可以看看NOSQL系列。诸如Mongo、Cassandra等。

幻天芒 | 园豆：37261 (高人七级) | 2014-11-10 10:57

这两个库有什么特点能简单说下么？

支持(0) 反对(0) qwer075 | 园豆：127 (初学一级) | 2014-11-10 11:17

@qwer075:

http://baike.baidu.com/subview/3385614/9338180.htm?fr=aladdin

http://baike.baidu.com/view/1350234.htm?fr=aladdin

支持(0) 反对(0) 幻天芒 | 园豆：37261 (高人七级) | 2014-11-10 11:20

JQuery Autocomplete

msikruby | 园豆：136 (初学一级) | 2014-11-10 13:51

？？？

支持(0) 反对(0) qwer075 | 园豆：127 (初学一级) | 2014-11-10 16:51

一般来说大数据都是用nosql来储存，但是nosql都比较吃内存，如果内存够就转存到nosql里，内存不够，就分库，分表，分批次进行查询然后导出到一个新表中，获取了数据删除表即可

收获园豆：10

有色白水 | 园豆：212 (菜鸟二级) | 2014-11-10 20:42

清除回答草稿

您需要登录以后才能回答，未注册用户请先注册。

欢迎，请先 登录 或者 注册 。