Ruby正则表达式中\A、\z和^ $的区别

Question

Ruby正则表达式中\A、\z和^ $的区别

rubyregex

232

在文档中我读到：

使用 \A 和 \z 匹配字符串的开头和结尾，使用 ^ 和 $ 匹配行的开头/结尾。

我将应用正则表达式来检查用户提交的用户名（或电子邮件）。我应该在模型中使用哪个表达式与validates_format_of一起使用？我不理解它们的区别：我一直使用^和$...

- collimarco

http://guides.rubyonrails.org/security.html#regular-expressions - Ivan Chau

4个回答

203

根据Pickaxe的说明：

^匹配行的开头。

$匹配行的结尾。

\A匹配字符串的开头。

\z匹配字符串的结尾。

\Z匹配字符串的结尾，除非字符串以"\n"结束，在这种情况下，它会在"\n"之前匹配。

因此，应该使用\A和小写的\z。如果使用\Z，则可能会出现换行符，这不会有危险，但可能会破坏假定字符串中没有空格的算法。根据您的正则表达式和字符串长度限制，某些人可能会使用仅包含换行符的不可见名称。JavaScript的正则表达式实现将\A视为字面值'A' (参考)。因此，在那里要注意自己的测试。

- Ragmaanir

24

示例演示区别

/^foo$/ 匹配以下任意一个，/\Afoo\z/ 不匹配：

whatever1
foo
whatever2

foo
whatever2

whatever1
foo

/^foo$/ 和 /\Afoo\z/ 都匹配以下内容：

foo

- Chun Yang

20

字符串的起始和结束位置不一定与行的起始和结束位置相同。想象一下，如果您将以下内容用作测试字符串：

我的
名字
是
安德鲁

请注意，该字符串有多行 - ^和$字符允许您匹配这些行的开头和结尾（基本上将\n字符视为分隔符），而\A和\Z允许您匹配整个字符串的开头和结尾。

- Andrew Hare

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Luke · Accepted Answer

如果您要使用正则表达式进行验证，您应始终使用\A和\z。 ^和$只会匹配到换行符之前的部分，这意味着它们可以使用像 me@example.com\n<script>dangerous_stuff();</script>这样的电子邮件地址仍然能够验证，因为正则表达式只看到\n之前的所有内容。

我的建议是先完全去除用户名或电子邮件中的换行符，因为几乎没有合法的原因需要保留它们。然后您可以安全地使用\A\z或^$。