使用带有特殊字符的URL名称是一个好主意吗?

6
在URL中使用非英语字符,如中文名称,对于SEO是否有好处?

我发现中文有一种官方的转录系统,叫做http://en.wikipedia.org/wiki/Pinyin。这意味着使用ASCII URL不应该出现任何问题。但我不确定Google是否会翻译这些类型的URL? - jpkeisala
我不确定其他(非中文)网站是否能够使用那种URL,因为它们的解析器/正则表达式限制可能会对您的网站页面排名产生负面影响。 - zgorawski
这并不是真正与编程有关的内容。 - Gumbo
1
相关:https://dev59.com/93E85IYBdhLWcg3wgDvd中的Unicode字符 - Pekka
谢谢您的提问,但这个问题应该在webmasters.stackexchange.com上询问@jpkeisala - ericn
2
@fuzzybee 是的,当然可以,但这个问题比webmasters.stackexchange.com更早。 - jpkeisala
8个回答

4

从SEO角度来看

通用URL规则:

  • 网站上的所有URL必须按照以下规则(按优先级列出)

1)唯一的(1个URL==1个资源)

2)永久性的(它们不会改变)

3)可管理的(每个站点部分都有一个逻辑,没有复杂的例外)

4)易于扩展的逻辑

5)短的

6)带有目标关键字短语

目标关键字短语最不重要,但仍然很重要。如果您可以使用具有非英文字符的短、可扩展、可管理、永久、唯一的URL逻辑,则请尝试。

如果URL与搜索词匹配,则有益处,因为搜索词在SERP中突出显示,此外,URL是最常用的锚文本(因为人们倾向于复制并粘贴URL),因此,如果您在URL中使用关键字(无论使用哪种语言),则可以获得很酷的锚文本,另外,URL关键字被视为内容,并添加了页面上下文,这是另一个SEO加分项。

所以,如果不违反1到5原则,请使用它。


2
截至今年6月,ICANN已批准在域名中使用中文字符,无需在结尾处使用.cn。

这仍然不意味着在URL中使用未编码的中文字符是有效的。但是,这是有用的信息。 - Pekka
@Pekka:即使代码是有效的,也不意味着这样做是个好主意。 - Stefan Steiger
@Quandary 嗯,对于我们这些拉丁字母为基础的国家来说,这很容易说...我能理解不能使用本地脚本编写域名和电子邮件地址是很烦人的。对于我们程序员来说,实现它仍然非常痛苦和昂贵,毫无疑问。 - Pekka
@Pekka: 我同意,尽管在我的情况下,德语只有额外的ÄÖÜ,即使在普通德语中也可以转义为ae oe ue,其余部分都是相同的。只有当你有几个这样的字符连在一起时,或者如果我的同事在 SQL 列名中使用其中一个字符,而我必须在仅使用 ASCII 的 Windows 命令行上合并我的脚本时,才会有些烦恼...然而,我可以想象对于中文用户来说可能略有不同。尽管如此,这仍然不是一个好主意。 - Stefan Steiger
@Quandary 是的。国际化应该在30-40年前就考虑到了 - 这将防止我们今天不得不使用的糟糕的胶带修复...Punycode,代码页... - Pekka
确实。例如,看看Windows的MinGW编译器。我们已经进入了2010年,但C++ STL Unicode部分至少仍然不完整。微软做得稍微好一些,但并不是真正的很好。 - Stefan Steiger

2
我不会这样做,原因很简单:电子邮件。
电子邮件协议尚未包含这些字符(可能是未来会有)。因此,如果您的域名是www.äüö.com,您不能使用邮件地址<...>@äöü.com
请参考第一条评论以获取解决方案。

1
错误。你需要使用浏览器,将äöü.com解析为punycode网址,然后用xn-whatever.com替换äöü.com。虽然在普通用户方面,你说得没错,他们可能太蠢了,而且像Outlook这样的MS程序还没有自动执行punycode转换的功能(顺便提一下,Mozilla Thunderbird有)。 - Stefan Steiger
也许他的意思不是域名,而是URL的其余部分。我认为如果网站只服务于中国受众,并且对SEO有好处,那么这是可以的。 - Yasen Zhelev

1

不是这样的。首先,您在DNS系统中注册域名时会遇到问题(必须将其解析为punycode)。

其次,Googlebot和BingBot非常重视URL中的关键字(PageRank),如果您的URL是punycode /任何编码,则不幸的是这些关键字将无法识别(也许Google已经解决了这个问题,但微软可能需要一两年时间)。

第三,就页面名称而言,浏览器必须支持这些语言,对于任何非英语的内容,这是不确定的。


1

简单来说,SEO希望您的网址易于访问,而我不确定人们是否能轻松地编写像这样的网址:

www.çakıöğünüveşarkı.com

首先,你的URL将会非常不友好... 这个网站是一个简单的工具,用于检查SEO的URL...
大多数基于Web的框架都支持将页面名称转换为可访问的URL。
所以, 1- 保持你的URL可访问 2- 定义你的页面标题和元标签,使蜘蛛可以正确地读取它们,因为元标签对特殊字符没有任何问题...

0

我对SEO不是很确定。但既然你已经将它与可用性标记在一起,我想补充说这不是一个很好的主意。对于没有中文键盘布局的人来说,输入你的URL几乎是不可能的。除非它在SEO方面非常重要,否则我建议你远离它。


3
如果URL包含中文字符,那么我猜它是针对使用中文键盘的中国受众。 - Carlos Muñoz
也许吧,但一个优秀的网页开发者不能把这当作理所当然。尤其是如果网页能够带来销售的话。 - Joyce Babu
1
如果规范中明确说明了,那么你可以认为它是理所当然的。如果你在制作仅在本地(非英语地区)有意义的网站,则这是完全合理的。 - Carlos Muñoz
我不准备打架。我只是表达了我的观点。除非非常重要,否则我永远不会这样做。你的网站,你的规则。我的网站,我的规则 :) - Joyce Babu

0
如果大多数用户都是以本地语言搜索答案的中国人,那么答案就是

-1

URLs不能包含非ASCII字符。但是可以将非ASCII字符编码为ASCII。

在域名部分,您可以使用IDN。我不知道它有多好的支持,但它确实存在。

在路径部分,您可以对Unicode代码点使用%转义符号。这在当前浏览器中得到了很好的支持,并且被搜索引擎理解-因此它确实是良好的SEO。我们正在使用它来处理欧洲重音字符,一切都很正常。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接