首页新闻找找看学习计划

海量数据相似度匹配

0
悬赏园豆:50 [已关闭问题] 关闭于 2017-11-19 10:27

请问各位大神,当海量数据相似度匹配时,怎么找出最匹配的数据。比如匹配客户号和客户的手机号,很有可能匹配。当输入客户号有可能匹配不出对应的客户。因为手机号也是相似。如果要找出20条相似的记录,怎么在海量数据中最快的匹配出来?

S-Roc的主页 S-Roc | 初学一级 | 园豆:12
提问于:2014-04-11 19:52
< >
分享
所有回答(2)
0

直接用数据透视表,速度还行.要用代码的话,可以用模糊匹配的方法去实现.

EDM数据 | 园豆:209 (菜鸟二级) | 2014-04-11 22:56

如果有很多字段去做模糊匹配,海量数据时不是很慢嘛?

支持(0) 反对(0) S-Roc | 园豆:12 (初学一级) | 2014-04-11 23:03

如果有很多字段去做模糊匹配,海量数据时不是很慢嘛?

支持(0) 反对(0) S-Roc | 园豆:12 (初学一级) | 2014-04-12 00:04

如果有很多字段去做模糊匹配,海量数据时不是很慢嘛?

支持(0) 反对(0) S-Roc | 园豆:12 (初学一级) | 2014-04-12 00:04
0

利用lucene先建立一个索引,然后就可以进行高效的全文搜索了,毫秒级返回查询结果

凤凰涅磐欲重生 | 园豆:264 (菜鸟二级) | 2014-04-12 22:30
清除回答草稿
   您需要登录以后才能回答,未注册用户请先注册