首页 新闻 会员 周边 捐助

请教关于LUCENE 盘古分词的权重问题

0
[已解决问题] 解决于 2010-08-31 13:03

请教各问题

      我现在用盘古分词在制作一个搜索小应用,请问如何能调整输出结果的权重 比如 我搜索 ‘你好’空格 ‘美女’能最先显示包括 ‘你好美女’的内容 然后在试 包括 '你好'和'美女'的

 

谢谢各位了!

菜光的主页 菜光 | 初学一级 | 园豆:108
提问于:2010-08-30 16:15
< >
分享
最佳答案
1

这个和盘古分词的权重没有关系,是 lucene 的得分算法缺陷,因为那个算法忽略了单词位置,只判断单词的出现频率,当然这个频率并不是简单的计数,有个公式的。我的另外一个开源项目hubbledotnet 在得分算法上参考斯坦福大学的信息检索教程做了很大的改进,匹配的准确性比lucene 要高很多,速度和易用性方面都比lucene 要好,由于盘古分词也是我开发的,两者之间可以配合的很好。你可以试试hubbledotnet 的效果。

看下面两篇,有问题可以联系我。

http://www.cnblogs.com/eaglet/archive/2010/05/13/1734273.html

http://www.cnblogs.com/eaglet/archive/2010/08/30/1812650.html

eaglet | 专家六级 |园豆:17139 | 2010-08-31 07:38

这个组件很不错!谢谢 

lichao8872 | 园豆:230 (菜鸟二级) | 2016-11-15 17:05
清除回答草稿
   您需要登录以后才能回答,未注册用户请先注册