如何防止Google和其他搜索引擎索引我的网站?
我知道这是一个非常老的问题,但我想强调@Julien的评论作为实际答案。
根据Joost de Valk的说法,robots.txt确实可以防止搜索引擎爬取您的网站,但如果其他网站链接到您的网站,则仍然可能在搜索结果中出现指向您网站的链接。
解决方案之一是在页面头部添加robots meta标签:
<meta name="robots" content="noindex,nofollow"/>
或者,更简单的方法是在您的.htaccess文件中添加以下内容:
Header set X-Robots-Tag "noindex, nofollow"
显然,您的Web主机必须允许.htaccess规则,并安装mod_headers
模块,才能使用该选项。
这两个标签都可以防止搜索引擎跟随指向您网站的链接,并在搜索结果中显示您的页面。双赢,宝贝。
robots.txt
的文件,其内容如下:# robots.txt for yoursite
User-agent: *
Disallow: /
搜索引擎(以及大多数机器人)将尊重此文件的内容。您可以放置任意数量的Disallow: /path
行以使机器人忽略。更多详细信息请参见robotstxt.org。