用搜索引擎搜索时,如果搜索词有点不对,它会提示 比如搜“大连外语学院”, 它会提示目前显示的是“大连外国语学院 ”的搜索结果,即多了一个“国”,见图片。
那么一般的网站的内部搜索也会碰到同样的问题,怎么实现呢?
可以将问题归纳为字符串相似性吗?
360的
百度的
谷歌的
我觉得这是肯定可以归纳为字符串的相似性的。
关键是你怎么将用户输入的关键词 和 你已经存储的字符串进行相似性的比较。
如果你有上亿条 存储的字符串,那么用数据库的like就已经很慢了。
like
需要大数据处理,不止代码的模糊匹配了