首页 新闻 搜索 专区 学院

关于uv的统计问题,假若用户没接收cookie,怎么利用IP与useragent来断定是否为同一个用户?

0
悬赏园豆:40 [待解决问题]

公司刚做基于hadoop的日志处理,目前在用CNZZ的统计,问题是我们做的日志分析系统与CNZZ的差距都比较明显,uv的统计相差30%,而我们没有实现与CNZZ的无接收cookie的用户重复判断,这个是一个关键点,所以来问问了。另外,要提一下的一个现象,就是我们的日志中发现一些高访的IP,来多数自于IDC,个别不能确定。而CNZZ的统计中,这些IP都是基本查不到的,怀疑是爬虫,但不敢确定是否为CDN的IP,望各路厉害大神出手相助,小弟万分感激!!!谢谢了

Sadrm的主页 Sadrm | 初学一级 | 园豆:164
提问于:2015-05-08 14:25
< >
分享
所有回答(2)
0

不接收cookie的基本都是爬虫,建议与Google Analytics对比一下。 

dudu | 园豆:39028 (高人七级) | 2015-05-08 14:35

我是需要收集所有爬虫IP的列入访问黑名单吗,而且小部分用户也存在有一定频率的清除cookie行为,这也对我们的统计有一定的影响了

支持(0) 反对(0) Sadrm | 园豆:164 (初学一级) | 2015-05-08 14:54
0

如果你只统计访客, 当然要把爬虫,cdn等不需要关注的IP列入灰名单了, 至于清除cookie的问题, 你没法精准统计的。

问天何必 | 园豆:3301 (老鸟四级) | 2015-05-08 15:33
清除回答草稿
   您需要登录以后才能回答,未注册用户请先注册