我想做一个抓取优酷,土豆等视频网站的视屏下载地址的工具,用webbrowser把网页加载进来了以后,用关键字“.mp4”,“.flv”,“.f4v”去检索,居然没有,但是有个叫“硕鼠”的网站又能解析出它的下载地址,这是怎么回事?它的下载地址在哪里?怎么抓取出来啊
优酷是去取一个json字段,里面的字段需要解码,土豆的直接找到xml文件就可以了,网上搜索下吧。
这个没研究过,学习ing````
每个视频网站可能都是不一样的,根据网站的架构不同,为考虑分布式、稳定性、并发量、广告投放等因素,网站会做部分负载均衡、以及分布式等架构设计。URL会有消息协议来进行视频加载。特定的视频网站需要了解架构、分析协议才能做出精准的抓取。
这个估计不好找,因为这些视频有收费的,不会把视频的地址轻易露出了