你这说的是嘛意思呀?
文章分类肯定得有一个分类表了,然后看你是想设计成一个文章只能有一个分类还是可以有多个分类,如果是可以有多个分类,那可以再建一个文章ID和分类ID的对应表或者在文章表中有一个字段可以保存多个分类ID,用","号他隔。
然后呢,你还可以使用标签,可以为文章设置标签,然后文章可以按标签来搜索。
是这样的:从各大网站抓取文章,给抓取过来的文章进行分类。
@苍狼老贼: 那你有自己的分类规则吗?
抓取的时候也是能抓取到文章的分类的吧,可以把分类添加到自己库里的表中,如果有就直接读取,如果没有就增加,这样呢?
@Alex_QY1987: 有的文章没有分类,可以通过url,或是title大概确定下,但准确度太低,如果准确度高些就ok了。有没有其他的方法?
@苍狼老贼: 方法有啊,大数据,你基于几千万篇文章,进行大数据分析,最终出来的就是所谓的人工智能。
@爱编程的大叔: 不是很明白。搜索推荐我不熟悉,可以详细下哦!大侠
@苍狼老贼: 这个无关技术,我的意思是你想太多了。
跟某些想要做智能拼音转汉字的人差不多,逻辑上你想想看,就知道难度有多大了,
如果你只是要做分词,这个也是很高难度的,你可以看下
火力全开——仿造Baidu简单实现基于Lucene.net的全文检索的功能
分词都这么麻烦了,你还想智能分类,OMG(你知道我是在说Oh My God吗?)
- - 你得设计好自己的表啊 不太明白你意思
从各大网站抓取文章,给抓取过来的文章进行分类。有的文章没有分类,可以通过url,或是title大概确定下,但准确度太低,如果准确度高些就ok了。有没有其他的方法?
这也能急,电脑发明了不到100年,人工智能还是想象中的事情,你急啥?
我开始的时候也想问这个问题的,但是后来我改变想法了,自己慢慢琢磨,还能提高自己推广方面的能力。