现在要用.net做一个类似于“百度知道”的系统。
在“百度知道”上提问,他会根据你所提问内容,默认动态的给你分类。
请问这是用的什么技术,或者是基于什么原理或方式。
按关键词或关键词频率分析吧,比如分析你里面含有10个“硬盘”词语,而其它的词都没这么多,它就可能分为电脑配件啊。专门有一个表对应这些关键词和类别的。
那这个表的数据岂不是很大,因为中文字这么多,截取关键字那数据应该很大吧。还是我对你的理解不对呢,帮忙再说详细一些吧,谢谢!
@七夜雪: 不用把所有中文都放在表中的,只要把一些“关键词”,也就是一些能特别说明是什么类别的词语,也是人家最常用的一些词语。假如他写的没有这些词的话,就当成默认类别。
@LCM: 非常感谢你的回答!
除了楼上说的还有一种方法,就是根据你的标题或内容进行查找,在查找到的内容中取用的最多的分类
查找还是要按关键字来看吧,那就是还是要一张表来维护关键字吧,可是中文字这么多,那维护量也太大了吧,还是说我对你们说的理解本身就有错误,帮忙在解答详细一些吧,谢谢!
@七夜雪: 我说的“根据你的标题或内容进行查找”不是从数据库中查找,是用类似lucene的搜索引擎查找的
@artwl: 非常感谢您的回答,我在研究一些搜索引擎吧,谢谢!