首页新闻找找看学习计划
当前位置:博问标签/爬虫/未解决/ 已解决
2
回答数

待解决问题 PHP curl爬虫如何爬取动态网页?

PHP新手,在写爬虫练手,一般情况下跟踪链接不是很难,但是如果是动态页面就束手无策了。也许分析协议(但是怎么分析?),模拟执行JavaScript脚本(怎么弄?),……另外可能写一个通用的爬取AJAX
1
回答数

待解决问题 20 怎么使用爬虫采集知乎上的问题和答案

要采集知乎上的问题和答案以及评论等这些数据,一般的采集器都无法做到。我也一直在搜索这方面相关的采集和爬虫,终于发现了一个叫神箭手云爬虫的(地址是:http://www.shenjianshou.cn/
5
回答数

待解决问题 5 爬虫获取不到网页源码

用了python和c#爬这个网站https://exchange.xforce.ibmcloud.com/activity 但是就只能得到上图中的代码,不能获取全部内容,不知道怎么回事,求教大家~
1
回答数

待解决问题 10 使用Threading.EnterWriteLock多线程并发问题

写了个多线程爬虫,每次取得数据后都向日志文件写入一条信息。但是使用EnterWriteLock之后还是会随机出现 文件被进程占用无法访问的错误。代码如下 /// 将日志信息写入文件 /// </sum
1
回答数

待解决问题 10 python爬虫抓取google搜索结果出现403的问题?

最近学习了下爬虫,觉得python不错。试着写了个抓取百度搜索结果的爬虫,成功抓取成功了。我试着依样画葫芦,想抓取一下google的搜索结果。结果,却失败了。下面是我的抓取代码: 没有成功抓到搜索结果
3
回答数

待解决问题 10 C# 网络爬虫模拟登陆新浪微博

内容详情请点击问题查看!
1
回答数

待解决问题 10 网站设置了反爬虫,怎么办

要爬取网页,如www.39.net网站里的数据,但是该网页却设置了反爬虫,不能把网页爬下来,请问,如何才能把网页爬下来,谢谢,急用。。。。
1
回答数

待解决问题 10 perl文本处理

内容详情请点击问题查看!
1
回答数

待解决问题 20 perl处理网页信息

内容详情请点击问题查看!