爬虫得到源代码只有<html><head></head><body></body></html>

-1

悬赏园豆：10 [已解决问题] 解决于 2018-02-11 15:43

如题~~~~requests.get()请求

爬虫

Janannnn | 初学一级 | 园豆：59
提问于：2018-02-10 09:44

< >

最佳答案

现在的网站有些，都有防爬虫的，需要模拟浏览器。加入在header里面加入模拟浏览器的参数,

{

'User-Agent':'Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US; rv:1.9.1.6) Gecko/20091201 Firefox/3.5.6'

}

，有时候还需要模拟cookic

收获园豆：10

muamaker | 小虾三级 |园豆：763 | 2018-02-10 14:03

ao奥奥- -

Janannnn | 园豆：59 (初学一级) | 2018-02-11 15:42

其他回答(4)

你要爬的网页是不是ajax的？

正经人 | 园豆：204 (菜鸟二级) | 2018-02-10 13:52

shi是啊 --

支持(0) 反对(0) Janannnn | 园豆：59 (初学一级) | 2018-02-11 15:42

爬那个网站，代码贴一点。我们才好分析。

retnil | 园豆：1696 (小虾三级) | 2018-02-10 14:48

反爬虫。。。

ycyzharry | 园豆：25692 (高人七级) | 2018-02-11 09:44

ao奥奥懂了- -

支持(0) 反对(0) Janannnn | 园豆：59 (初学一级) | 2018-02-11 15:42

方便的话, 你倒是把网站地址发出来, 让我们都看看到底是如何的网站

兴想事成 | 园豆：540 (小虾三级) | 2018-02-12 16:35

清除回答草稿

您需要登录以后才能回答，未注册用户请先注册。

欢迎，请先 登录 或者 注册 。