首页新闻找找看学习计划

爬虫得到源代码只有<html><head></head><body></body></html>

-1
悬赏园豆:10 [已解决问题] 解决于 2018-02-11 15:43

如题~~~~requests.get()请求

Janannnn的主页 Janannnn | 初学一级 | 园豆:59
提问于:2018-02-10 09:44
< >
分享
最佳答案
1

现在的网站有些,都有防爬虫的,需要模拟浏览器。加入在header里面加入模拟浏览器的参数,

{
    'User-Agent':'Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US; rv:1.9.1.6) Gecko/20091201 Firefox/3.5.6'
}
 
,有时候还需要模拟cookic
收获园豆:10
muamaker | 小虾三级 |园豆:584 | 2018-02-10 14:03

ao奥奥- -

Janannnn | 园豆:59 (初学一级) | 2018-02-11 15:42
其他回答(4)
0

你要爬的网页是不是ajax的?

正经人 | 园豆:204 (菜鸟二级) | 2018-02-10 13:52

shi是啊 -- 

支持(0) 反对(0) Janannnn | 园豆:59 (初学一级) | 2018-02-11 15:42
0

爬那个网站,代码贴一点。我们才好分析。

hellotim | 园豆:1442 (小虾三级) | 2018-02-10 14:48
0

反爬虫。。。

ycyzharry | 园豆:18832 (专家六级) | 2018-02-11 09:44

ao奥奥  懂了- -

支持(0) 反对(0) Janannnn | 园豆:59 (初学一级) | 2018-02-11 15:42
0

方便的话, 你倒是把网站地址 发出来, 让我们都看看 到底是 如何的网站

兴想事成 | 园豆:352 (菜鸟二级) | 2018-02-12 16:35
清除回答草稿
   您需要登录以后才能回答,未注册用户请先注册