首页 新闻 赞助 找找看

网页抓取问题

0
悬赏园豆:20 [已解决问题] 解决于 2012-02-29 17:58

目标网页:http://stockhtm.finance.qq.com/sstock/ggcx/000157.shtml?pgv_ref=aio

抓取方式:URLConnection并设置了USER-AGENT等头信息

问题描述:该网页上的个股信息,比如开盘价使用火狐的FIREBUG可以抓取并看到源代码的数据,但是右键查看网页源代码却发现开盘价对应的地方被"-"代替。通过程序返回也是没有开盘价的价格,而是"-"。这个现象不知是不是腾讯的反爬虫功能还是什么。求教。

Mr.xiong的主页 Mr.xiong | 初学一级 | 园豆:79
提问于:2011-11-06 08:42
< >
分享
最佳答案
0

这肯定是ajax啊,用firebug,查看下网络吧,你用URLConnection 连接到正确的url才能获取正确的数据啊

收获园豆:15
道法安然 | 菜鸟二级 |园豆:225 | 2012-02-29 11:28
其他回答(1)
-1

应该是脚本计算的结果,只request到源代码是找不到的,分析他的计算方法,或者看还有哪些ajax请示。

收获园豆:5
Astar | 园豆:40805 (高人七级) | 2011-11-06 10:34
清除回答草稿
   您需要登录以后才能回答,未注册用户请先注册