首页 新闻 搜索 专区 学院

网络爬虫,通用的正文提取有没有好的代码或者思路

0
悬赏园豆:20 [已解决问题] 解决于 2018-11-05 23:00

随便发送一个链接判断

是否是正文链接,如果是提取正文,如果有图片怎么处理

煤炭g的主页 煤炭g | 初学一级 | 园豆:129
提问于:2017-10-13 02:49
< >
分享
最佳答案
0

不要图片就不管,要图片的话就找到图片地址下载下来

收获园豆:20
Masako | 小虾三级 |园豆:1893 | 2017-10-13 10:02
其他回答(2)
0

多写一些,写着写着,就通用了。

Supper_litt | 园豆:793 (小虾三级) | 2017-10-13 09:21
0

试试正文密度提取算法

ABeen | 园豆:251 (菜鸟二级) | 2018-11-06 12:11
清除回答草稿
   您需要登录以后才能回答,未注册用户请先注册