grep 正则表达式空格行为

Question

115

我有一个文本文件，其内容类似于：

12,34 EUR 
 5,67 EUR
 ...

在“EUR”之前有一个空格，我忽略了0,XX欧元。

我尝试了：

grep '[1-9][0-9]*,[0-9]\{2\}\sEUR' => 没有匹配！

grep '[1-9][0-9]*,[0-9]\{2\} EUR' => 成功匹配！

grep '[1-9][0-9]*,[0-9]\{2\}\s*EUR' => 成功匹配！

grep '[1-9][0-9]*,[0-9]\{2\}\s[E]UR' => 成功匹配！

请问有人能解释一下为什么我不能使用 \s ，但是 \s* 和 \s[E] 可以匹配吗？

操作系统：Ubuntu 10.04，grep v2.5

- Milde

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Kamal · Accepted Answer

这似乎是grep 2.5和更新版本之间在处理\s时的行为差异（旧版grep中的错误？）。我用grep 2.5.4确认了你的结果，但使用grep 2.6.3（Ubuntu 10.10）时，你的四个grep都可以工作。

注意：

GNU grep 2.5.4
echo "foo bar" | grep "\s"
   (doesn't match)

相反，

GNU grep 2.6.3
echo "foo bar" | grep "\s"
foo bar

可能会少一些麻烦（因为\s没有文档记录）：

Both GNU greps
echo "foo bar" | grep "[[:space:]]"
foo bar

我的建议是避免使用\s...而是使用[ \t]*或[[:space:]]或类似的东西。