限制索引并删除当前索引

3

我翻阅了一些关于这个主题的问题,但我仍不确定我是否理解正确。

我有一个PHP文件,根据GET参数返回XML / JSON响应。

http://someDomain.com/get.php?param=option1

谷歌已经索引了很多这些网址。

据我所知,我可以通过添加someDomain.com/robots.txt来限制机器人进一步索引someDomain.com上的网址:

User-agent: *
Disallow: *

我知道通过添加robots.txt文件,搜索引擎将无法看到noindex元标记来删除当前索引的URL。

但是get.php并没有返回任何元标记/头部信息,因为它只返回json/xml数据。

那么我该如何让Google从搜索结果中删除已经被索引的URL?


使用301重定向对Google机器人进行重定向。 - Amit Verma
@Starkeen 你的意思是像这样吗:Redirect 301 /get.php /blackwhole/?我该如何只重定向谷歌机器人而不影响其他内容? - James May
1个回答

1

在htaccess中尝试以下代码:

RewriteEngine On

#If user agent is "googlebot"
RewriteCond %{HTTP_USER_AGENT} googlebot [NC]
#And query string is "param=anychar"
RewriteCond %{QUERY_STRING} ^param=(.+)$ [NC]
#Then 301 redirect "get.php" to "/backwhole"
RewriteRule ^get\.php$ /backwhole [L,R=301]

1
谢谢您的回答。只有一个小问题:我应该放什么在/blackhole文件夹中?是输出一个“禁止”的标头的index.php文件吗?我不想为了这个而创建一个目录并进行重定向,我该如何让htaccess文件返回“禁止”或类似的标头呢?这可能吗? - James May
1
请问您能否澄清一下?'blackwhole'只是一个例子。它仍然不能完全回答我的问题。 - James May

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接