我有一个暂存网站,用于草拟新功能、更改和实际网站的内容。
我不希望这被索引,但我希望有一个比在每个页面上都添加以下内容更容易的解决方案:
<meta name="robots" content="noindex, nofollow">
我能否以类似于使用.htaccess文件为域名添加密码的方式来完成这个操作?
我有一个暂存网站,用于草拟新功能、更改和实际网站的内容。
我不希望这被索引,但我希望有一个比在每个页面上都添加以下内容更容易的解决方案:
<meta name="robots" content="noindex, nofollow">
我能否以类似于使用.htaccess文件为域名添加密码的方式来完成这个操作?
这个可以用 robots.txt标准 来实现。示例:
User-agent: *
Disallow: /protected-directory/
搜索引擎会遵守这个规则,但当然内容仍会被发布(如果您在 robots.txt 中放置了 URL,则可能更容易被发现),因此也可以通过 .htaccess 进行密码保护。
User-agent: *
Disallow: /mybetasite/
实际上,在网站根目录下放置robots.txt
文件是最好的方法。
如果要添加多个条目(如OP所建议的),请按照以下步骤进行:
User-agent: *
Disallow: /test_directory_aaa/
Disallow: /test_directory_bbb/
Disallow: /test_directory_ccc/
.htpasswd
方法:AuthType Basic
AuthName "Marty's test directory"
AuthUserFile /test_directory_aaa/.htpasswd
AuthUserFile /test_directory_bbb/.htpasswd
AuthUserFile /test_directory_ccc/.htpasswd
require valid-user
username1:s0M3md5H4sh1
username2:s0M3md5H4sh2
username3:s0M3md5H4sh3
User-agent: *
Disallow: /
User-agent: *
Disallow: /foldername/
foldername 是您想要阻止的目录名称。
阻止特定文件对SEO的影响: 要指定匹配URL结尾,请使用$。例如,阻止任何以.xls结尾的URL:
User-agent: * Disallow: /*.xls$
Ref: http://antezeta.com/news/avoid-search-engine-indexing
http://support.google.com/webmasters/bin/answer.py?hl=en&answer=156449&topic=1724262&ctx=topic