请问各位大神,当海量数据相似度匹配时,怎么找出最匹配的数据。比如匹配客户号和客户的手机号,很有可能匹配。当输入客户号有可能匹配不出对应的客户。因为手机号也是相似。如果要找出20条相似的记录,怎么在海量数据中最快的匹配出来?
直接用数据透视表,速度还行.要用代码的话,可以用模糊匹配的方法去实现.
如果有很多字段去做模糊匹配,海量数据时不是很慢嘛?
利用lucene先建立一个索引,然后就可以进行高效的全文搜索了,毫秒级返回查询结果