首页 新闻 会员 周边

百度知道-默认发布类别

1
悬赏园豆:20 [待解决问题]

现在要用.net做一个类似于“百度知道”的系统。

在“百度知道”上提问,他会根据你所提问内容,默认动态的给你分类。

请问这是用的什么技术,或者是基于什么原理或方式。

七夜雪的主页 七夜雪 | 初学一级 | 园豆:125
提问于:2011-12-26 16:26
< >
分享
所有回答(3)
1

按关键词或关键词频率分析吧,比如分析你里面含有10个“硬盘”词语,而其它的词都没这么多,它就可能分为电脑配件啊。专门有一个表对应这些关键词和类别的。

LCM | 园豆:6876 (大侠五级) | 2011-12-26 16:29

那这个表的数据岂不是很大,因为中文字这么多,截取关键字那数据应该很大吧。还是我对你的理解不对呢,帮忙再说详细一些吧,谢谢!

支持(0) 反对(0) 七夜雪 | 园豆:125 (初学一级) | 2011-12-26 16:42

@七夜雪: 不用把所有中文都放在表中的,只要把一些“关键词”,也就是一些能特别说明是什么类别的词语,也是人家最常用的一些词语。假如他写的没有这些词的话,就当成默认类别。

支持(0) 反对(0) LCM | 园豆:6876 (大侠五级) | 2011-12-26 16:44

@LCM: 非常感谢你的回答!

支持(0) 反对(0) 七夜雪 | 园豆:125 (初学一级) | 2011-12-26 16:51
0

除了楼上说的还有一种方法,就是根据你的标题或内容进行查找,在查找到的内容中取用的最多的分类

artwl | 园豆:16736 (专家六级) | 2011-12-26 16:30

查找还是要按关键字来看吧,那就是还是要一张表来维护关键字吧,可是中文字这么多,那维护量也太大了吧,还是说我对你们说的理解本身就有错误,帮忙在解答详细一些吧,谢谢!

支持(0) 反对(0) 七夜雪 | 园豆:125 (初学一级) | 2011-12-26 16:44

@七夜雪: 我说的“根据你的标题或内容进行查找”不是从数据库中查找,是用类似lucene的搜索引擎查找的

支持(0) 反对(0) artwl | 园豆:16736 (专家六级) | 2011-12-26 16:47

@artwl: 非常感谢您的回答,我在研究一些搜索引擎吧,谢谢!

支持(0) 反对(0) 七夜雪 | 园豆:125 (初学一级) | 2011-12-26 16:52
0

我觉得这个问题还是让用户(提问者)自己去选择的比较好。他要提问当然要自己做出一些选择,让程序去做有点麻烦。如果非要做的话,LCM的方案可行,artwl的方案不可行,因为最开始的几个问题直接影响到后面的分类,导致越来越不准。

夜の魔王 | 园豆:441 (菜鸟二级) | 2011-12-28 17:04
清除回答草稿
   您需要登录以后才能回答,未注册用户请先注册