需要把所有referrer都抓下来,然后去人工判断,常用的搜索引擎就那么几个,很容易知道的
对于邮件,建议在发邮件里,在链接里加个参数,比如:http://www.xxx.com/?frommail,这样当收到带frommail参数的请求时,就知道是从邮件过来的了。另外,可以给不同的邮件做不同的参数,还可以跟踪更具体的来源
邮件的方法不行,应用这个链接不是我们控制的,用户可以自己去加,如果用户不加这个参数的话,我们岂不是就不知道了吗,我就想区分哪些是我们自己的邮件来源,哪些是用户的邮件来源。多谢你的回答。
@张衡Henry: 可以跟搜索引擎那个一样处理,这样就可以知道哪些是来自邮件的,然后在你自己的邮件里加参数,这样没参数,且来源于邮件的,就是用户的邮件了
http的整个 请求头信息(标准协议内容) 都会有用的
比如:User-Agent(比如浏览器信息和爬虫的名字都可以看到)和Referer(来源地址,这个值不一样有)