网站日志异常增大，与百度有关

悬赏园豆：50 [已关闭问题] 关闭于 2010-05-31 17:43

网站中有一重定向页面，在某些情况下先进入重定向页面做某些处理，再返回原来页面，但在日志中却发现重复爬取的重定向页面信息，已经在robots.txt中禁止访问重定向页面，但有一带baidu+Transcoder标识的爬虫却反复爬取，导致日志文件非常大，请问大家有什么好的方法。

.NET技术 ASP.NET

冷于冰 | 初学一级 | 园豆：0
提问于：2010-05-19 10:47

< >

所有回答(2)

想访问原来的页面是不是必须经过重定向页面？

Astar | 园豆：40805 (高人七级) | 2010-05-19 11:45

在cookie保存值后不必重定向

支持(0) 反对(0) 冷于冰 | 园豆：0 (初学一级) | 2010-05-20 10:41

1、确认你的robots.txt文件的语法正确。
# robots.txt for http://www.bmshops.com/
#
# $Id: robots.txt,v 1.59 2010/04/25 15:52:50 $
#

# exclude some access-controlled areas
User-agent: *
Disallow: /重定向页面

2、屏蔽baidu+Transcoder标识的爬虫的ip对网站的访问

上不了岸的鱼 | 园豆：4613 (老鸟四级) | 2010-05-19 13:34

1、robots格式没错，百度一般的爬虫已经不访问了，但是baidu+Transcoder标志的一直访问， 2、屏蔽ip会不会对收录有影响

支持(0) 反对(0) 冷于冰 | 园豆：0 (初学一级) | 2010-05-20 10:44

清除回答草稿

您需要登录以后才能回答，未注册用户请先注册。

欢迎，请先 登录 或者 注册 。