如题:
网易的博客是用dwr做的,请问如何抓取网易的日志
抓取日志的话,最好的办法还是通过RSS,否则的话,就要分析模板,通过特征标签(比如class/id)等去分析,然后使用字符串处理函数或正则表达式去提取你想要的内容 PS:网易博客不是DWR做的,这个我可以证明
- -严重同意楼上的!!如果你是大量抓取的话。。就用正则吧 慢慢分析 囧
推荐使用神箭手云爬虫去抓取