你已经知道需要什么了(只是不知道具体参数),这有什么问头,还不得具体网站具体分析和查找。
cookie是很方便,但不一定认证授权就要用这个来实现,比如我有时候就根本不用这个。
有一些网站本身就是为了屏蔽直接的http请求式访问,各种绕。
但有一种服务器是无解的 —— 直接基于浏览器,除非用插件,然后还有淘宝这种验证较难破解的。
我是说,为什么我用cookies无法绕过登录了(针对知乎和微博)。
是不是除了cookies还有其它验证,我需要怎样做才能发现其中的问题。
@嘘,小点声: 很容易证实:用tcp 直接 完整 copy 整个http请求,你慢慢核对就知道差什么了。
没有账号密码你怎么爬数据??? 就算是cookie或者token,那也是登录后返回的认证,所以至少要账号密码登录一下再做下一步操作
我说的就是用登录后返回的cookies,重新导入未登录的界面。