必应机器人将Unicode字符转换为无法理解的符号

7

当必应尝试索引一些包含Unicode字符的页面时,我的网站会出现许多错误。

例如:

http://www.example.com/kjøp 

必应正在尝试索引。
http://www.example.com/kjøp

然后我遇到了一个错误“System.NullReferenceException: Object reference not set to an instance of an object.”,因为没有这样的控制器。

谷歌在处理此类链接时效果很好。如何帮助必应理解挪威字母?


你是否明确指定了页面的编码/字符集? - n0p
1
你是指这个吗?<meta http-equiv="content-type" content="text/html;charset=utf-8" /> 我有它。 - podeig
是的,这就是我的意思。所以如果您拥有此标签并且确实拥有有效的 utf-8 内容,也许问题在必应方面? 顺便说一句,可能是重复内容 - n0p
你是如何确定Bing尝试索引这个URL的呢? - unor
我从Elmah得到错误信息:“System.NullReferenceException: Object reference not set to an instance of an object.”,其中HTTP_FROM是bingbot(at)microsoft.com,错误的URL是http://www.example.com/kjøp。 - podeig
这里似乎有问题,Bing刚刚搞乱了URL中的所有UTF-8编码。 - user7180
1个回答

0

您可以通过执行“INURL:”搜索来确认Bing未正确索引这些URL,如下所示... https://www.bing.com/search?q=inurl%3A%C3%B8

只有6个页面被索引,这显然是不正确的。

不幸的是,您无法修复Bing。但是,您可能可以通过对您的网站进行一些更改来弥补其缺陷。这是一个您不应该处理的负担。但是,另一个选择是什么都不做,继续无法正确链接页面。

Bing可能会出现以下列表中包含字符的URL问题... https://www.i18nqa.com/debug/utf8-debug.html

您的Web服务器需要查找包含这些字符的URL请求。然后,您将使用正确的字符替换错误的字符,并对正确的页面进行301重定向。具体操作取决于您使用的服务器和编程语言类型。在您的情况下,最可能是IIS和MVC,因此您最好查看Microsoft的URL Rewrite扩展。https://www.iis.net/downloads/microsoft/url-rewrite

但在此之前,我建议您先查看Bing网站管理员工具提供的错误信息。 https://www.bing.com/toolbox/webmaster

另一种选择是不在您的URL中使用这些字符。我的建议是花时间进行错误到正确的翻译。Bing最终会解决这个问题,但可能需要相当长的时间。


可能会相当长一段时间? :D 永恒......因为这些人生活在石器时代! - MTK

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接