源码:import requests
headers = {‘User-Agent’: ‘Mozilla/5.0 (Macintosh; U; PPC Mac OS X; en-US; rv:1.0.1) Gecko/20021104 Chimera/0.6’,
}
url = ‘https://feed.mix.sina.com.cn/api/roll/get?pageid=153&lid=2509&k=&num=50&page=1’
resp = requests.get(url,headers=headers)
print(resp.status_code)
试了一下用curl都能访问到这个链接,是不是你的linux的ip有问题。
确实时我的IP问题,我用的阿里云,它的IP有问题,我设置一层代理IP 成功爬取了内容。
把自己的完整 tcp 字节码打出来对比不就知道了。
大佬能将详细点吗,我小白,有点不太明白完整tcp字节码怎么弄,另外怎么对比这个字节码呢。万分感谢,
@哔哔~~: http是由tcp实现的字节码协议。你可以自己写代码,也可以用很多现成工具。
比如你可以用fiddler代理看raw,一般爬数据测试不过,很简单 —— 直接tcp把raw写进入就行了。
当然这里你只是找问题,你自己分别去看看请求对比一下就知道了。方法已经告诉你了,工具具体使用也很简单,不清楚网上有一大把。
@花飘水流兮: 谢谢大佬