目标网页:http://stockhtm.finance.qq.com/sstock/ggcx/000157.shtml?pgv_ref=aio
抓取方式:URLConnection并设置了USER-AGENT等头信息
问题描述:该网页上的个股信息,比如开盘价使用火狐的FIREBUG可以抓取并看到源代码的数据,但是右键查看网页源代码却发现开盘价对应的地方被"-"代替。通过程序返回也是没有开盘价的价格,而是"-"。这个现象不知是不是腾讯的反爬虫功能还是什么。求教。
这肯定是ajax啊,用firebug,查看下网络吧,你用URLConnection 连接到正确的url才能获取正确的数据啊
应该是脚本计算的结果,只request到源代码是找不到的,分析他的计算方法,或者看还有哪些ajax请示。