首页 新闻 会员 周边
2
回答数

待解决问题 如何从海量网页中抽取出作者,时间,评论内容等信息?

hbase中有海量网页源代码,需要从海量源代码中精确抽取出【作者,时间,评论内容,点击数】等信息,请问,我该按照什么步骤,思路操作?
2
回答数

待解决问题 舆情系统开发团队

公司准备外包舆情用爬虫,我找了很久没结果,跪求高手指点