首页 新闻 会员 周边

如何设计一种只需要针对文章的标题进行分词搜索,而不需要对文章内容全文搜索。

0
悬赏园豆:20 [已解决问题] 解决于 2012-03-18 23:10

例如:文章标题是: 中国劣货盛行的原因

假设用户输入:“中国房价上涨的原因”   采用某种分词技术 分词后为:中国 房价 上涨 的 原因

                  如何在后台进行搜索匹配并将全部匹配的信息排在第一条,之后将近似的信息靠后排序?

                  后台的文章标题是否要在建立文章的同时也进行分词并存储?

期待你的解答。Thanks.

Proxima的主页 Proxima | 初学一级 | 园豆:120
提问于:2012-03-14 01:55
< >
分享
最佳答案
0
收获园豆:8
dudu | 高人七级 |园豆:30994 | 2012-03-14 10:48
其他回答(3)
0

使用Luncene进行索引的建立和搜索就行

至于标题是文档格式的处理吧,使用Tika这个Luncene的辅助库就可以

收获园豆:5
2012 | 园豆:21230 (高人七级) | 2012-03-14 08:22
0

用luncene.net 或者可以去网上找一个分词库也行

收获园豆:2
az235 | 园豆:8483 (大侠五级) | 2012-03-14 08:46
0

现在比较成熟的是用lucene,参考:http://home.cnblogs.com/group/topic/4683.html

收获园豆:5
artwl | 园豆:16736 (专家六级) | 2012-03-14 09:12
清除回答草稿
   您需要登录以后才能回答,未注册用户请先注册