海量数据相似度匹配

悬赏园豆：50 [已关闭问题] 关闭于 2017-11-19 10:27

请问各位大神，当海量数据相似度匹配时，怎么找出最匹配的数据。比如匹配客户号和客户的手机号，很有可能匹配。当输入客户号有可能匹配不出对应的客户。因为手机号也是相似。如果要找出20条相似的记录，怎么在海量数据中最快的匹配出来？

海量数据相似度

Roc-Lee | 初学一级 | 园豆：12
提问于：2014-04-11 19:52

< >

所有回答(2)

直接用数据透视表,速度还行.要用代码的话,可以用模糊匹配的方法去实现.

EDM数据 | 园豆：209 (菜鸟二级) | 2014-04-11 22:56

如果有很多字段去做模糊匹配，海量数据时不是很慢嘛？

支持(0) 反对(0) Roc-Lee | 园豆：12 (初学一级) | 2014-04-11 23:03

如果有很多字段去做模糊匹配，海量数据时不是很慢嘛？

支持(0) 反对(0) Roc-Lee | 园豆：12 (初学一级) | 2014-04-12 00:04

如果有很多字段去做模糊匹配，海量数据时不是很慢嘛？

支持(0) 反对(0) Roc-Lee | 园豆：12 (初学一级) | 2014-04-12 00:04

利用lucene先建立一个索引，然后就可以进行高效的全文搜索了，毫秒级返回查询结果

凤凰涅磐欲重生 | 园豆：264 (菜鸟二级) | 2014-04-12 22:30

清除回答草稿

您需要登录以后才能回答，未注册用户请先注册。

欢迎，请先 登录 或者 注册 。