首页 新闻 会员 周边

如何自动下载一部分网页?

0
[已解决问题] 解决于 2018-01-24 13:19

请问各位大神,我想从思科的网站上下载几个不同型号的命令手册(html格式),但有一部分链接不想下载,比如公司介绍,配置手册等,有什么办法可以实现吗?
具体例子:
打开思科的网站(https://www.cisco.com/c/en/us/support/switches/index.html)
只下载3650型号的相关资料,点击“Catalyst 3650 Series Switches”(https://www.cisco.com/c/en/us/support/switches/catalyst-3650-series-switches/tsd-products-support-series-home.html)
只下载命令手册,在打开的新的页面中点击“Command References”(https://www.cisco.com/c/en/us/support/switches/catalyst-3650-series-switches/products-command-reference-list.html)
在新的页面里,下载除了“News & Alerts”,“Information For”等和命令无关的所有的命令手册。
请大神不吝赐教!拜托拜托!

芽衣的主页 芽衣 | 菜鸟二级 | 园豆:384
提问于:2018-01-21 15:08
< >
分享
最佳答案
0

一共也没多少 有写代码那个时间 手动就下载完了

奖励园豆:5
ycyzharry | 高人七级 |园豆:25653 | 2018-01-22 09:35

很多的,几乎全部的装置里的命令手册 都下载,每个装置目录结构都不一样,只下载一部分手动花了4天时间,以后还有其他装置的手册要下载,所以才想要自动下载。

芽衣 | 园豆:384 (菜鸟二级) | 2018-01-22 10:51

@徐池俊: 可以用 selenium webdriver 模拟点击网址和下载按钮 

ycyzharry | 园豆:25653 (高人七级) | 2018-01-22 10:54
其他回答(1)
0

自己写程序抓取

dudu | 园豆:30994 (高人七级) | 2018-01-21 15:55
清除回答草稿
   您需要登录以后才能回答,未注册用户请先注册