Bingbot每天会在几个小时内频繁抓取我的网站,其余时间则非常少。我希望可以平滑它的爬行、降低其速率限制或完全阻止它。因为它并没有发送任何真实访问者。
有没有办法可以平滑Bingbot的爬行或者对其进行速率限制?
Bingbot每天会在几个小时内频繁抓取我的网站,其余时间则非常少。我希望可以平滑它的爬行、降低其速率限制或完全阻止它。因为它并没有发送任何真实访问者。
有没有办法可以平滑Bingbot的爬行或者对其进行速率限制?
User-agent: msnbot
Crawl-delay: 1
在网站管理员常见问题解答PDF文件中有更详细的解释。
这些链接也可能会有所帮助:
http://www.bing.com/toolbox/webmasters
http://www.bing.com/community/webmaster/f/12252/t/651373.aspx
您可以通过设置IPTables来限制爬虫对f.i.的连接数量为5(需要防火墙Root访问权限):
IPTables的设置: iptables -I INPUT -p tcp -m connlimit --connlimit-above 5 -j REJECT
这将限制每个IP地址的连接数不超过5个。这种“配额”式的连接方式能够避免爬虫同时访问站点。
你可以使用HTACCESS封禁他的IP。
order allow,deny
deny from 192.168.44.201
deny from 224.39.163.12
deny from 172.16.7.92
allow from all
更多相关信息请点击这里:关于机器人阻止的博客