如何在使用FOR XML PATH时删除嵌套查询中的冗余名称空间

18

更新: 我发现Microsoft Connect已经就此问题提出了一个问题 在这里

当使用FOR XML PATHWITH XMLNAMESPACES来声明默认命名空间时,对于使用FOR XML的嵌套查询的任何顶级节点,我将获得重复的命名空间声明。我在网上找到了一些解决方案,但我并不完全相信...

以下是一个完整的示例

/*
drop table t1
drop table t2
*/
create table t1 ( c1 int, c2 varchar(50))
create table t2 ( c1 int, c2 int, c3 varchar(50))
insert t1 values 
(1, 'Mouse'),
(2, 'Chicken'),
(3, 'Snake');
insert t2 values
(1, 1, 'Front Right'),
(2, 1, 'Front Left'),
(3, 1, 'Back Right'),
(4, 1, 'Back Left'),
(5, 2, 'Right'),
(6, 2, 'Left')



;with XmlNamespaces( default 'uri:animal')
select 
    a.c2 as "@species"
    , (select l.c3 as "text()" 
       from t2 l where l.c2 = a.c1 
       for xml path('leg'), type) as "legs"
from t1 a
for xml path('animal'), root('zoo')

什么是最佳解决方案?


你能展示一下你的FOR XML PATH查询以及带有额外命名空间的结果XML吗?在屏幕上看到这些东西有助于诊断/建议解决方法... - marc_s
我已经添加了一个完整的工作示例。 - Dog Ears
6个回答

15
经过数小时的绝望和数百次尝试和错误,我想出了以下解决方案。当我只想在根节点上拥有一个xmlns属性时,我遇到了同样的问题。但是我的查询非常复杂,有很多子查询,而仅使用FOR XML EXPLICIT方法就太麻烦了。因此,是的,我希望在子查询中享受FOR XML PATH的便利,并设置自己的xmlns。
我友好地借用了8kb答案的代码,因为它非常好。我稍微调整了一下以便更好地理解。以下是代码:
DECLARE @Order TABLE (OrderID INT, OrderDate DATETIME)    
DECLARE @OrderDetail TABLE (OrderID INT, ItemID VARCHAR(1), Name VARCHAR(50), Qty INT)    
INSERT @Order VALUES (1, '2010-01-01'), (2, '2010-01-02')    
INSERT @OrderDetail VALUES (1, 'A', 'Drink',  5),
                           (1, 'B', 'Cup',    2),
                           (2, 'A', 'Drink',  2),
                           (2, 'C', 'Straw',  1),
                           (2, 'D', 'Napkin', 1)

-- Your ordinary FOR XML PATH query
DECLARE @xml XML = (SELECT OrderID AS "@OrderID",
                        (SELECT ItemID AS "@ItemID", 
                                Name AS "data()" 
                         FROM @OrderDetail 
                         WHERE OrderID = o.OrderID 
                         FOR XML PATH ('Item'), TYPE)
                    FROM @Order o 
                    FOR XML PATH ('Order'), ROOT('dummyTag'), TYPE)

-- Magic happens here!       
SELECT 1 AS Tag
      ,NULL AS Parent
      ,@xml AS [xml!1!!xmltext]
      ,'http://test.com/order' AS [xml!1!xmlns]
FOR XML EXPLICIT

结果:

<xml xmlns="http://test.com/order">
  <Order OrderID="1">
    <Item ItemID="A">Drink</Item>
    <Item ItemID="B">Cup</Item>
  </Order>
  <Order OrderID="2">
    <Item ItemID="A">Drink</Item>
    <Item ItemID="C">Straw</Item>
    <Item ItemID="D">Napkin</Item>
  </Order>
</xml>

如果你只选择了@xml,你会发现它包含根节点dummyTag。我们不需要它,因此我们使用directive xmltextFOR XML EXPLICIT查询中将其删除。
,@xml AS [xml!1!!xmltext]

尽管MSDN上的解释听起来更复杂,但实际上它告诉解析器选择XML根节点的内容。
现在还不确定查询的速度有多快,但我目前正在像绅士一样放松地喝着苏格兰威士忌,平静地盯着这段代码...

运行得很好,如果命名空间无效,命名空间将被添加... - user6110389

11
如果我理解正确的话,您指的是在以下查询中可能会看到的行为:
DECLARE @Order TABLE (
  OrderID INT, 
  OrderDate DATETIME)

DECLARE @OrderDetail TABLE (
  OrderID INT, 
  ItemID VARCHAR(1), 
  ItemName VARCHAR(50), 
  Qty INT)

INSERT @Order 
VALUES 
(1, '2010-01-01'),
(2, '2010-01-02')

INSERT @OrderDetail 
VALUES 
(1, 'A', 'Drink',  5),
(1, 'B', 'Cup',    2),
(2, 'A', 'Drink',  2),
(2, 'C', 'Straw',  1),
(2, 'D', 'Napkin', 1)

;WITH XMLNAMESPACES('http://test.com/order' AS od) 
SELECT
  OrderID AS "@OrderID",
  (SELECT 
     ItemID AS "@od:ItemID", 
     ItemName AS "data()" 
   FROM @OrderDetail 
   WHERE OrderID = o.OrderID 
   FOR XML PATH ('od.Item'), TYPE)
FROM @Order o 
FOR XML PATH ('od.Order'), TYPE, ROOT('xml')

这将会得到以下结果:

<xml xmlns:od="http://test.com/order">
  <od.Order OrderID="1">
    <od.Item xmlns:od="http://test.com/order" od:ItemID="A">Drink</od.Item>
    <od.Item xmlns:od="http://test.com/order" od:ItemID="B">Cup</od.Item>
  </od.Order>
  <od.Order OrderID="2">
    <od.Item xmlns:od="http://test.com/order" od:ItemID="A">Drink</od.Item>
    <od.Item xmlns:od="http://test.com/order" od:ItemID="C">Straw</od.Item>
    <od.Item xmlns:od="http://test.com/order" od:ItemID="D">Napkin</od.Item>
  </od.Order>
</xml>

正如您所说,命名空间在子查询结果中重复。

根据devnetnewsgroup上的一次讨论(该网站现已关闭),这种行为是一种功能,尽管有vote更改的选项。

我提出的解决方案是回滚到FOR XML EXPLICIT

SELECT
  1 AS Tag,
  NULL AS Parent,
  'http://test.com/order' AS [xml!1!xmlns:od],
  NULL AS [od:Order!2],
  NULL AS [od:Order!2!OrderID],
  NULL AS [od:Item!3],
  NULL AS [od:Item!3!ItemID]
UNION ALL
SELECT 
  2 AS Tag,
  1 AS Parent,
  'http://test.com/order' AS [xml!1!xmlns:od],
  NULL AS [od:Order!2],
  OrderID AS [od:Order!2!OrderID],
  NULL AS [od:Item!3],
  NULL [od:Item!3!ItemID]
FROM @Order 
UNION ALL
SELECT
  3 AS Tag,
  2 AS Parent,
  'http://test.com/order' AS [xml!1!xmlns:od],
  NULL AS [od:Order!2],
  o.OrderID AS [od:Order!2!OrderID],
  d.ItemName AS [od:Item!3],
  d.ItemID AS [od:Item!3!ItemID]
FROM @Order o INNER JOIN @OrderDetail d ON o.OrderID = d.OrderID
ORDER BY [od:Order!2!OrderID], [od:Item!3!ItemID]
FOR XML EXPLICIT

并查看这些结果:

<xml xmlns:od="http://test.com/order">
  <od:Order OrderID="1">
    <od:Item ItemID="A">Drink</od:Item>
    <od:Item ItemID="B">Cup</od:Item>
  </od:Order>
  <od:Order OrderID="2">
    <od:Item ItemID="A">Drink</od:Item>
    <od:Item ItemID="C">Straw</od:Item>
    <od:Item ItemID="D">Napkin</od:Item>
  </od:Order>
</xml>

1
谢谢你的回答,你有没有想法来比较一下这个和另一个方案?(请看我对自己问题的回答) - Dog Ears

4

我见过的另一种解决方案是在将XML构建为临时变量后添加XMLNAMESPACES声明:

declare @xml as xml;
select @xml = (
select 
    a.c2 as "@species"
    , (select l.c3 as "text()" 
       from t2 l where l.c2 = a.c1 
       for xml path('leg'), type) as "legs"
from t1 a
for xml path('animal'))

;with XmlNamespaces( 'uri:animal' as an)
select @xml for xml path('') , root('zoo');

1
对于1百万行,您的解决方案运行速度快了两倍。=(虽然每个“species”行中都有一个xmlns =“” 。这有关系吗?关于FOR XML EXPLICIT方法的有趣之处在于它允许您执行多个命名空间。我不确定您如何使用其他解决方案来实现这一点(尽管如果您没有这个需求,那可能并不重要)。如果您感兴趣,可以在此处链接到性能测试:http://tinyurl.com/3yejtyv - 8kb
1
我已经更改了结果以删除空名称空间,但最终无论如何,我想这种方法生成的XML看起来很好,但实际上并不是有效的。因此,我接受了8kb的答案作为最佳方法。 - Dog Ears
DEFAULT命名空间会在第一个子节点中添加空的xmlns属性 <leveranse xmlns=""> - user6110389

1
这里的问题是,当使用XML PATH时,您无法直接手动声明命名空间。 SQL Server将禁止以“xmlns”开头的任何属性名称和带有冒号的任何标签名称。
与其不得不使用相对不友好的XML EXPLICIT,我通过首先生成具有“伪装”命名空间定义和引用的XML,然后进行以下字符串替换来解决问题...
DECLARE @Order TABLE (
  OrderID INT, 
  OrderDate DATETIME)

DECLARE @OrderDetail TABLE (
  OrderID INT, 
  ItemID VARCHAR(1), 
  ItemName VARCHAR(50), 
  Qty INT)

INSERT @Order 
VALUES 
(1, '2010-01-01'),
(2, '2010-01-02')

INSERT @OrderDetail 
VALUES 
(1, 'A', 'Drink',  5),
(1, 'B', 'Cup',    2),
(2, 'A', 'Drink',  2),
(2, 'C', 'Straw',  1),
(2, 'D', 'Napkin', 1)

declare @xml xml

set @xml = (SELECT
  'http://test.com/order' as "@xxmlns..od",  -- 'Cloaked' namespace def
  (SELECT OrderID AS "@OrderID", 
    (SELECT 
      ItemID AS "@od..ItemID", 
      ItemName AS "data()" 
     FROM @OrderDetail 
     WHERE OrderID = o.OrderID 
     FOR XML PATH ('od..Item'), TYPE)
   FROM @Order o
   FOR XML PATH ('od..Order'), TYPE)
  FOR XML PATH('xml'))

set @xml = cast(replace(replace(cast(@xml as nvarchar(max)), 'xxmlns', 'xmlns'),'..',':') as xml)

select @xml

需要指出的几点:

  1. 我使用“xxmlns”作为我的“xmlns”的伪装版本,“..”代替“:”。如果您可能在文本值中使用“..”,则此方法可能不适用于您 - 您可以将其替换为其他内容,只要选择一个有效的XML标识符即可。

  2. 由于我们希望在顶层定义xmlns,因此无法使用XML PATH的“ROOT”选项 - 相反,我需要向子查询结构添加另一个外部级别来实现此目的。


这绝对是对问题精心思考过的回复。但是,这个问题是在6年前提出的,这里提供的答案应该被新读者视为一个最近的解决方案,用来解决潜在的长期问题。 - Claies
1
@Claies - 是的,绝对没错 - 我当然不指望 OP 在这么长时间之后还对我的答案感兴趣!- 这个回答肯定是针对其他寻找此问题解决方案的读者(就像我一样),据我所知,这个问题在 SQL Server 2016 中仍然存在。 - David Claughton
我现在忘记了XML是什么,抱歉!(无论如何,因为你提供了高质量的答案,我还是给你点赞了!) - Dog Ears
像这样操作XML的字符串是不安全的。如果您在值的文本节点中有字符串xxmlns..,会怎么样呢?例如,如果您在处理此stackoverflow答案的XML导出的代码中运行此代码,会怎么样呢?您至少提到了这一点作为警告,但我认为,即使如此,由于这个问题,这个答案也不应被视为有效。 - binki
對我來說,這是目前最好的解決方案,因為沒有FOR XML PATHNONAMESPACE選項。雖然它對可讀性沒有幫助,特別是在我的情況下,有多個xmlns聲明和一個xsi:schemalocation,可能由超過一個xsd組成,但它是唯一一個a)適用於我的用例且b)仍然基本保持與我開始的FOR XML PATH查詢相同。 - Tom Lint

0

我对所有这些解释感到有些困惑,而手动声明“xmlns:animals”却可以完成工作:

这里是我编写的一个示例,用于生成开放图谱元数据

DECLARE @l_xml as XML;
SELECT @l_xml = 
(
SELECT 'http://ogp.me/ns# fb: http://ogp.me/ns/fb# scanilike: http://ogp.me/ns/fb/scanilike#' as 'xmlns:og',
    (SELECT
        (SELECT 'og:title' as 'property', title as 'content' for xml raw('meta'), TYPE),
        (SELECT 'og:type' as 'property', OpenGraphWebMetadataTypes.name as 'content' for xml raw('meta'), TYPE),
        (SELECT 'og:image' as 'property', image as 'content' for xml raw('meta'), TYPE),
        (SELECT 'og:url' as 'property', url as 'content' for xml raw('meta'), TYPE),
        (SELECT 'og:description' as 'property', description as 'content' for xml raw('meta'), TYPE),
        (SELECT 'og:site_name' as 'property', siteName as 'content' for xml raw('meta'), TYPE),
        (SELECT 'og:appId' as 'property', appId as 'content' for xml raw('meta'), TYPE)
     FROM OpenGraphWebMetaDatas INNER JOIN OpenGraphWebMetadataTypes ON OpenGraphWebMetaDatas.type = OpenGraphWebMetadataTypes.id WHERE THING_KEY = @p_index 
     for xml path('header'), TYPE),
     (SELECT '' as 'body' for xml path(''), TYPE)
     for xml raw('html'), TYPE
)

RETURN @l_xml 

返回预期结果

<html xmlns:og="http://ogp.me/ns# fb: http://ogp.me/ns/fb# scanilike: http://ogp.me/ns/fb/scanilike#">
<header>
<meta property="og:title" content="The First object"/>
<meta property="og:type" content="scanilike:tag"/>
<meta property="og:image" content="http://www.mygeolive.com/images/facebook/facebook-logo.jpg"/>
<meta property="og:url" content="http://www.scanilike.com/opengraph?id=1"/>
<meta property="og:description" content="This is the very first object created using the IOThing &amp; ScanILike software. We keep it in file for history purpose. "/>
<meta property="og:site_name" content="http://www.scanilike.com"/>
<meta property="og:appId" content="200270673369521"/>
</header>
<body/>
</html>

希望这能帮助那些在网上搜索类似问题的人。;-)


太好了!所以不明显的技巧是使用 for xml raw 选择 元素,但内部元素仍然可以使用 for xml path - Björn Lindqvist
实际上,只有在设置非默认的“xmlns:og”时才能正常工作,如果要设置默认的“xmlns”,则仍然会出现重复的命名空间声明。 - Björn Lindqvist

0

如果 FOR XML PATH 能够更干净地工作,那就太好了。使用 @table 变量重新设计您的原始示例:

declare @t1 table (c1 int, c2 varchar(50));
declare @t2 table (c1 int, c2 int, c3 varchar(50));
insert @t1 values 
    (1, 'Mouse'),
    (2, 'Chicken'),
    (3, 'Snake');
insert @t2 values
    (1, 1, 'Front Right'),
    (2, 1, 'Front Left'),
    (3, 1, 'Back Right'),
    (4, 1, 'Back Left'),
    (5, 2, 'Right'),
    (6, 2, 'Left');

;with xmlnamespaces( default 'uri:animal')
select  a.c2 as "@species",
    (
        select  l.c3 as "text()"
        from    @t2 l
        where   l.c2 = a.c1
        for xml path('leg'), type
    ) as "legs"
from @t1 a
for xml path('animal'), root('zoo');

返回具有重复命名空间声明的问题XML:

<zoo xmlns="uri:animal">
  <animal species="Mouse">
    <legs>
      <leg xmlns="uri:animal">Front Right</leg>
      <leg xmlns="uri:animal">Front Left</leg>
      <leg xmlns="uri:animal">Back Right</leg>
      <leg xmlns="uri:animal">Back Left</leg>
    </legs>
  </animal>
  <animal species="Chicken">
    <legs>
      <leg xmlns="uri:animal">Right</leg>
      <leg xmlns="uri:animal">Left</leg>
    </legs>
  </animal>
  <animal species="Snake" />
</zoo>

您可以使用通配符命名空间匹配(即,*:elementName)的 XQuery 在命名空间之间迁移元素,如下所示,但对于复杂的 XML 来说可能会很繁琐:

;with xmlnamespaces( default 'http://tempuri.org/this/namespace/is/meaningless' )
select (
    select  a.c2 as "@species",
        (
            select  l.c3 as "text()"
            from    @t2 l
            where   l.c2 = a.c1
            for xml path('leg'), type
        ) as "legs"
    from @t1 a
    for xml path('animal'), root('zoo'), type
).query('declare default element namespace "uri:animal";
<zoo>
{ for $a in *:zoo/*:animal return
    <animal>
    {attribute species {$a/@species}}
    { for $l in $a/*:legs return
        <legs>
        { for $m in $l/*:leg return
            <leg>{ $m/text() }</leg>
        }</legs>
    }</animal>
}</zoo>');

这将产生您所期望的结果:

<zoo xmlns="uri:animal">
  <animal species="Mouse">
    <legs>
      <leg>Front Right</leg>
      <leg>Front Left</leg>
      <leg>Back Right</leg>
      <leg>Back Left</leg>
    </legs>
  </animal>
  <animal species="Chicken">
    <legs>
      <leg>Right</leg>
      <leg>Left</leg>
    </legs>
  </animal>
  <animal species="Snake" />
</zoo>

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接