例如:文章标题是: 中国劣货盛行的原因
假设用户输入:“中国房价上涨的原因” 采用某种分词技术 分词后为:中国 房价 上涨 的 原因
如何在后台进行搜索匹配并将全部匹配的信息排在第一条,之后将近似的信息靠后排序?
后台的文章标题是否要在建立文章的同时也进行分词并存储?
期待你的解答。Thanks.
试试盘古分词:http://www.cnblogs.com/eaglet/archive/2009/08/13/1545420.html
使用Luncene进行索引的建立和搜索就行
至于标题是文档格式的处理吧,使用Tika这个Luncene的辅助库就可以
用luncene.net 或者可以去网上找一个分词库也行
现在比较成熟的是用lucene,参考:http://home.cnblogs.com/group/topic/4683.html