首页 新闻 会员 周边

Visual-based 抓取技术是今日头条独创的抓取技术吗

0
悬赏园豆:20 [待解决问题]

有了解的朋友没,介绍下

目前,“今日头条”日处理网页超过100万,采用Visual-based 抓取技术以确保内容来源足够准确。CEO张一鸣介绍“今日头条”每个月都会新增上百信息源,产品经理会根据市场上信息源的热门程度决定添加哪家进入抓取源。

黄阿伦的主页 黄阿伦 | 初学一级 | 园豆:94
提问于:2013-09-02 17:59
< >
分享
所有回答(1)
0

这种技术不是没有实现可能,就是网页的正文提取机器学习算法,不依赖于网站结构,对网站正文实现抽取,我现在也正在做这部分的研究

DeeFOX | 园豆:202 (菜鸟二级) | 2014-03-25 19:56
清除回答草稿
   您需要登录以后才能回答,未注册用户请先注册