首页新闻找找看学习计划

C#模拟登陆后如何使用爬虫获取网站内的文件

0
悬赏园豆:50 [待解决问题]

注意一下:下载文件没有超链接,也就是说调用超链接下载是不可以的

只能通过先选择文件然后在点击下载btn下载

你的程序有BUG的主页 你的程序有BUG | 初学一级 | 园豆:111
提问于:2018-06-25 13:37
< >
分享
所有回答(3)
0

也就是说你需要一个js虚拟机,待dom创建分析dom。

花飘水流兮 | 园豆:10297 (专家六级) | 2018-06-25 13:47

我要使用的应该不是这一种方法,我想用的方法模拟点击还有就是直接读取文件流

支持(0) 反对(0) 你的程序有BUG | 园豆:111 (初学一级) | 2018-06-25 13:54
0

通过webbrowser模拟点击,然后监控http请求,监控到文件流,拦截并下载。这个我做过,过程并没有那么简单,一两天怕是很难搞定。可能需要用到windows api hook、http分析等知识。纯console程序实现怕是非常困难。

沧海一杰 | 园豆:28 (初学一级) | 2018-06-25 13:49

我要下载之前还要有一个选择下载文件的操作之后才可以点击下载(由于我现在没有上传照片的权限所以没法把我要读取网址的截图发上来,见谅) 有一个问题怎样才能监控到我的文件流?

支持(0) 反对(0) 你的程序有BUG | 园豆:111 (初学一级) | 2018-06-25 13:53

@你的程序有BUG: webbrowser自动化下载,你可以模拟点击和输入呀。当然如果异步请求,你还需要写异步请求跟踪监控的代码,这部分可能需要动态注入js代码来实现,实现起来并不轻松。

支持(0) 反对(0) 沧海一杰 | 园豆:28 (初学一级) | 2018-06-25 13:56

@沧海一杰: 请问你有一个案例吗?我想看看,我是项目需要刚接触爬虫没有多久

支持(0) 反对(0) 你的程序有BUG | 园豆:111 (初学一级) | 2018-06-25 14:01

@你的程序有BUG: 有,你的需要只是其中一个小模块,但不能给你,只能提供思路。

支持(0) 反对(0) 沧海一杰 | 园豆:28 (初学一级) | 2018-06-25 14:04

@你的程序有BUG: 有好几种方案呢,hook api, ShellWindows , 还有通过 webbrowser 的一些接口,你得好好研究一下,我的方案也不是最优的。

支持(0) 反对(0) 沧海一杰 | 园豆:28 (初学一级) | 2018-06-25 14:16

@你的程序有BUG: 对还有bho技术,可能有用。

支持(0) 反对(0) 沧海一杰 | 园豆:28 (初学一级) | 2018-06-25 15:12
0

具体问题具体分析吧,

Supper_litt | 园豆:970 (小虾三级) | 2018-06-25 18:09

主要是我技术的限制,刚接触这门技术不久

支持(0) 反对(0) 你的程序有BUG | 园豆:111 (初学一级) | 2018-06-26 08:22
清除回答草稿
   您需要登录以后才能回答,未注册用户请先注册