你应该请求 http://www.yanglee.com/ajax/ProductSearch.ashx?_=1411554850348&mode=Search&perpage=60&page=4&ProStr=NodeCode%253D%2527105015016005%2527%2520and%2520FlowState%253D99%2520and%2520IsDel%253D0%2520and%2520ProductLevel%253C%253E%2527VIP%2527%2520&strOrder=released%2520desc&ProductState=&jigou=&qixian=&shouyi=&InvestField=&ApplyWay= 这个url page参数可以分页,
请求头信息添加Referer: http://www.yanglee.com/product/product_Lists.aspx?ptype=105015016005
直接打开什么都没有,你是说要在HttpClient 设置setRequestHeader(“Referer”,“http://www.yanglee.com/product/product_Lists.aspx?ptype=105015016005”) 是吗?我试试
@assasszt: 是的
不好意思,最近才想起这个问题了;果然像你说的,加上来源链接就好使了;
我想知道,为什么是这样呢?
还有你是怎么知道 加上这个Referer就行了呢
这个确实有点难度,翻页显示的数据列表应该从文件“/ajax/ProductSearch.ashx”入手,看看数据是怎么从中间文件中返回的table数据,这样直接截取table数据就好了
要爬取js动态生成的数据,可以参考下这个:http://doc.shenjianshou.cn/developmentSkills/useAJAX.html