也就是说你需要一个js虚拟机,待dom创建分析dom。
我要使用的应该不是这一种方法,我想用的方法模拟点击还有就是直接读取文件流
通过webbrowser模拟点击,然后监控http请求,监控到文件流,拦截并下载。这个我做过,过程并没有那么简单,一两天怕是很难搞定。可能需要用到windows api hook、http分析等知识。纯console程序实现怕是非常困难。
我要下载之前还要有一个选择下载文件的操作之后才可以点击下载(由于我现在没有上传照片的权限所以没法把我要读取网址的截图发上来,见谅) 有一个问题怎样才能监控到我的文件流?
@你的程序有BUG: webbrowser自动化下载,你可以模拟点击和输入呀。当然如果异步请求,你还需要写异步请求跟踪监控的代码,这部分可能需要动态注入js代码来实现,实现起来并不轻松。
@沧海一杰: 请问你有一个案例吗?我想看看,我是项目需要刚接触爬虫没有多久
@你的程序有BUG: 有,你的需要只是其中一个小模块,但不能给你,只能提供思路。
@你的程序有BUG: 有好几种方案呢,hook api, ShellWindows , 还有通过 webbrowser 的一些接口,你得好好研究一下,我的方案也不是最优的。
@你的程序有BUG: 对还有bho技术,可能有用。
具体问题具体分析吧,
主要是我技术的限制,刚接触这门技术不久