请教关于LUCENE 盘古分词的权重问题

[已解决问题] 解决于 2010-08-31 13:03

请教各问题

我现在用盘古分词在制作一个搜索小应用，请问如何能调整输出结果的权重比如我搜索 ‘你好’空格 ‘美女’能最先显示包括 ‘你好美女’的内容然后在试包括 '你好'和'美女'的

谢谢各位了！

.NET技术 C#

菜光 | 初学一级 | 园豆：108
提问于：2010-08-30 16:15

< >

最佳答案

这个和盘古分词的权重没有关系，是 lucene 的得分算法缺陷，因为那个算法忽略了单词位置，只判断单词的出现频率，当然这个频率并不是简单的计数，有个公式的。我的另外一个开源项目hubbledotnet 在得分算法上参考斯坦福大学的信息检索教程做了很大的改进，匹配的准确性比lucene 要高很多，速度和易用性方面都比lucene 要好，由于盘古分词也是我开发的，两者之间可以配合的很好。你可以试试hubbledotnet 的效果。

看下面两篇，有问题可以联系我。

http://www.cnblogs.com/eaglet/archive/2010/05/13/1734273.html

http://www.cnblogs.com/eaglet/archive/2010/08/30/1812650.html

eaglet | 专家六级 |园豆：17139 | 2010-08-31 07:38

这个组件很不错！谢谢

lichao8872 | 园豆：230 (菜鸟二级) | 2016-11-15 17:05

清除回答草稿

您需要登录以后才能回答，未注册用户请先注册。