使用Linq to XML检索XML部分

3
以下是XML片段的一部分,它是一个更大的XML的一部分。我一遍又一遍地尝试着获取地址行1、2、3以及城市和州、邮政编码和国家。我想将其功能化,以便根据InvoiceHeader id="XXXX"选择这些地址,但我一直遇到问题。我尝试了下面的查询或类似的内容,但我一直收到错误信息“对象引用未设置为对象的实例”。请看一下我的查询,能否指出明显的错误。
 IEnumerable<string> partNos =
            from item in PurchaseOrderXml.Descendants("RemitTo").Descendants("Address")
            where (string)item.Attribute("id").Value == "23951768"
            select (string)item;



<Invoice>
    <InvoiceHeader id="23951768" status="InProcess">
        <InvoiceName />
        <InvoiceNumber>23951768</InvoiceNumber>
        <InvoiceDate>2014-09-26 00:00:00.0</InvoiceDate>
        <DueDate>2014-10-26 00:00:00.0</DueDate>
        <SupplierInvoiceNo>534254504</SupplierInvoiceNo>
        <InvoiceType>Invoice</InvoiceType>
      <Supplier id="3825405">
        <ContactInfo type="main">
              <Address>
                <AddressLine lineNumber="1">Post </AddressLine>
                <AddressLine lineNumber="2">30 Street</AddressLine>
                <AddressLine lineNumber="3">30 Street</AddressLine>
                <City>Saint Louis</City>
                <State>MO</State>
                <PostalCode>63103-2530</PostalCode>
                <Country isoCountryCode="US">United States</Country>
            </Address>
        </ContactInfo>
    </Supplier>
        <BillTo>
        <Address>
            <AddressLine lineNumber="1">vvvv</AddressLine>
            <AddressLine lineNumber="2">vvvv</AddressLine>
            <City>Philadelphia</City>
            <State>PA</State>
            <PostalCode>19222</PostalCode>
            <Country isoCountryCode="US">United States</Country>
        </Address>
          </BillTo>
        <RemitTo>
            <Address>
                <AddressLine lineNumber="1">P O BOX 535182</AddressLine>
                <AddressLine lineNumber="2" />
                <AddressLine lineNumber="3" />
                <City>ATLANTA</City>
                <State>GA</State>
                <PostalCode>303535182</PostalCode>
                <Country isoCountryCode="US">United States</Country>
            </Address>
        </RemitTo>
     </InvoiceHeader>
</Invoice>
2个回答

3

您的项目范围变量对应于没有id属性的Address元素。相反,您需要一个查询,该查询首先查找(或过滤)适当的InvoiceHeader,然后查找匹配的InvoiceHeader的Address元素后代。

以下是查找InvoiceHeader的示例:

var Header = PurchaseOrderXml.Descendants("InvoiceHeader")
.FirstOrDefault(header => (string)header.Attribute("id").Value == headerId);

您可以检查标头是否存在 (Header != null)。一旦您拥有了标头,可以在该元素的范围内执行所需的操作。例如:
var RemitToAddress = Header.Descendants("RemitTo").Descendants("Address").FirstOrDefault();

您可能想要检查标题中的其他元素,因此将查询分成几个部分可以使您的意图更清晰。

还要注意我使用了Descendants,但如果它更符合您的模式,则也可以使用Elements

另一个例子,要获取AddressLine元素并将它们连接起来,您可以尝试类似以下的操作:

IEnumerable<string> AddressLines = RemitToAddress.Elements("AddressLine")
.OrderBy(line => (int)line.Attribute("lineNumber"))
.Select(line => line.Value);

var AddressText = string.Join("\n", AddressLines);

所以我需要两个查询吗? - Miguel
我会更新以提供一个例子,但是从概念上讲,你需要两个查询,并将它们分开可能是有意义的。 - Michael Petito
一个例子将会非常有帮助,因为我正在努力学习钓鱼 :-D。 - Miguel
Michael,这非常干净,谢谢。只有一个问题。var remitoAddress的值以3个地址行连接结束。有没有逻辑上将它们分开的方法?对不起,我的问题很愚蠢。 - Miguel
当然,您可以进一步查询“RemitToAddress”元素。我会更新另一个示例。 - Michael Petito
清晰易懂,我完全理解你的方法。感谢您抽出时间! - Miguel

1
尝试一下这个:-
var result = xdoc.Root.Descendants("InvoiceHeader")
    .Where(x => x.Attribute("id").Value == "23951768")
    .SelectMany(x => x.Descendants("Address"))
    .Select(x =>
    {
       {
         var addressLine1 = x.Elements("AddressLine")
                        .FirstOrDefault(z => z.Attribute("lineNumber").Value == "1");
         var addressLine2 = x.Elements("AddressLine")
                        .FirstOrDefault(z => z.Attribute("lineNumber").Value == "2");
         var addressLine3 = x.Elements("AddressLine")
                        .FirstOrDefault(z => z.Attribute("lineNumber").Value == "3");
         return new
         {
            AddressLine1 = addressLine1 != null ? addressLine1.Value : String.Empty,
            AddressLine2 = addressLine2 != null ? addressLine1.Value : String.Empty,
            AddressLine3 = addressLine3 != null ? addressLine1.Value : String.Empty,
            City = x.Element("City").Value,
            State = x.Element("State").Value
            PostalCode = x.Element("PostalCode").Value,
            Country= x.Element("Country").Value,
          };
        }
    });

这似乎可以处理我上面发布的较小的XML,但是我在处理原始XML时遇到了问题。我收到的错误是“序列中不包含匹配的元素”?有什么想法吗? - Miguel
你的大型XML文件中,所有其他元素是否与此类似?我已经考虑到在“RemitTo”节点中可能有多个“Address”。序列不包含任何元素,没有元素与您传递的条件匹配,您可以进行调试并让我知道。 - Rahul Singh
我在我的较大的xml中有多个地址。我已经更新了我的帖子,提供了一个更相关的示例。我认为多个地址可能是导致linq查询出现问题的原因? - Miguel
如果您现在查看我的 XML,您会注意到我需要获取汇款地址的后代。 - Miguel
@miguel - 发生这种情况是因为您在第一个地址节点中没有地址行3,而我们正在尝试获取其值,因此它将在内部引发空引用异常,并且外部没有结果,请检查是否为空,然后再获取值。我会更新那段代码。 - Rahul Singh

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接