首页 新闻 会员 周边 捐助

python

0
[待解决问题]

想通过爬虫,将网页上的文章爬下来,整理归档,每篇文章对应一个pdf或者一个word。

NeXT、的主页 NeXT、 | 菜鸟二级 | 园豆:295
提问于:2018-08-28 14:24
< >
分享
所有回答(2)
0

如果是把静态网页爬成html格式的话直接用wget系统指令就行了。。。

happyZYM | 园豆:248 (菜鸟二级) | 2018-08-28 21:25

如果像这样的呢?

https://www.cnblogs.com/okong/p/springboot-twenty-six.html

打开这个页面,然后将这个页面的文章抽出来整理到pdf中

支持(0) 反对(0) NeXT、 | 园豆:295 (菜鸟二级) | 2018-08-29 10:29

@NeXT、: 到网上找一找有没有html转pdf的工具试试

支持(0) 反对(0) happyZYM | 园豆:248 (菜鸟二级) | 2018-08-29 10:32
1

三种Java下生成PDF方式的比较

Java生成PDF文件

...

网上很多这些内容啊!

 

python生成pdf报告、python实现html转换为pdf报告:https://www.cnblogs.com/shengulong/p/7994082.html

...

Python也有很多啊

快乐的欧阳天美1114 | 园豆:4010 (老鸟四级) | 2018-08-29 19:39
清除回答草稿
   您需要登录以后才能回答,未注册用户请先注册