python

[待解决问题]

想通过爬虫，将网页上的文章爬下来，整理归档，每篇文章对应一个pdf或者一个word。

NeXT、 | 菜鸟二级 | 园豆：295
提问于：2018-08-28 14:24

< >

所有回答(2)

如果是把静态网页爬成html格式的话直接用wget系统指令就行了。。。

happyZYM | 园豆：248 (菜鸟二级) | 2018-08-28 21:25

如果像这样的呢？

https://www.cnblogs.com/okong/p/springboot-twenty-six.html

打开这个页面，然后将这个页面的文章抽出来整理到pdf中

支持(0) 反对(0) NeXT、 | 园豆：295 (菜鸟二级) | 2018-08-29 10:29

@NeXT、: 到网上找一找有没有html转pdf的工具试试

支持(0) 反对(0) happyZYM | 园豆：248 (菜鸟二级) | 2018-08-29 10:32

三种Java下生成PDF方式的比较

Java生成PDF文件

...

网上很多这些内容啊！

python生成pdf报告、python实现html转换为pdf报告：https://www.cnblogs.com/shengulong/p/7994082.html

...

Python也有很多啊

快乐的欧阳天美1114 | 园豆：4010 (老鸟四级) | 2018-08-29 19:39

清除回答草稿

您需要登录以后才能回答，未注册用户请先注册。

欢迎，请先 登录 或者 注册 。