XSL - 删除不间断空格

Question

XSL - 删除不间断空格

4

在我的XSL实现中（2.0），我尝试使用以下语句来删除文本节点内的所有空格和非换行空格。它可以删除空格，但无法删除非换行空格，其ASCII代码为：

&#160; &#x20; &#xA0; &#X202F; &#x2000; &#x2001; &#x2002; &#x2003; &#x2004; &#x2005; &#x2006; &#x2007; &#x2008; &#x2009; &#x200A; &#x200B; &#xFEFF;

等。我正在使用SAXON处理器执行。

当前的XSL代码：

translate(normalize-space($text-nodes[1]),  ' ' , '' ))

我该如何将它们删除？请分享您的想法。

- Rachel

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- wdebeaum · Accepted Answer

这些代码是Unicode而不是ASCII（大部分情况下），因此您应该使用replace函数，其中包含Unicode分隔符字符类的regex：

replace($text-nodes[1], '\p{Z}+', '')

更详细地说：

正则表达式\p{Z}+匹配一个或多个Unicode中“分隔符”类别中的字符。\p{}是类别转义序列，它匹配在大括号中指定的类别中的单个字符。Z指定“分隔符”类别（包括各种空白字符）。+表示“匹配前面的正则表达式一次或多次”。replace函数返回其第一个参数的版本，并用其第二个参数替换所有不重叠的子字符串，替换为其第三个参数。因此，这将返回$text-nodes[1]的一个版本，其中所有分隔符字符序列都被替换为空字符串，即被删除。