使用“PreviousNode”进行C# LINQ XML解析

3

在Stack Overflow的帮助下,我成功地拼凑出了以下LINQ表达式。

var parentids = xliff.Descendants()
                     .Elements(xmlns + "trans-unit")
                     .Elements(xmlns + "seg-source")
                     .Elements(xmlns + "mrk")
                     .Where(e => e.Attribute("mtype").Value == "seg")
                     .Select(item => (XElement)item.Parent.Parent.PreviousNode)
                         .Where(item => item != null)
                         .Select(item => item.Elements(xmlns + "source")
                             .Where(itema => itema != null)
                             .Select(itemb => itemb.Elements(xmlns + "x")             
                             .LastOrDefault()
                             .Attribute("id")
                             .Value.ToString())).ToArray();

它的作用是找到一个具有@mtype="seg"属性的mrk标签,然后上溯到trans-unit祖先(.parent.parent)并检查前面的兄弟trans-unit是否有子节点trans,如果没有,则从source子节点中返回最后一个x元素的@id,否则返回null(必须返回null,不能只是不返回匹配项)。
我需要补充说明的是,虽然下面的示例只有一个没有trans元素的前一个节点,在实际的xml中还有许多这样的节点,因此我必须使用PreviousNode
以下是它可以处理的XML,并完美地返回"2"
<?xml version="1.0" encoding="utf-8"?>
<xliff xmlns:sdl="http://sdl.com/FileTypes/SdlXliff/1.0" version="1.2" sdl:version="1.0" xmlns="urn:oasis:names:tc:xliff:document:1.2">
  <file original="Pasadena_Internet_2016.xml" source-language="en-US" datatype="x-sdlfilterframework2" target-language="da-DK">
    <body>
      <trans-unit id="d679cb2d-ecba-47ba-acb7-1bb4a798c755" translate="no">
        <source>
          <x id="0" />
          <x id="1" />
          <x id="2" />
        </source>
      </trans-unit>
      <trans-unit id="aed9fde2-fd1b-4eba-bfc9-06d325aa7047">
        <source>
          <x id="3" />Pasadena, California’s iconic Colorado Boulevard <x id="4" />has been the site of the world-famous Tournament of Roses Parade since it began in 1890.
        </source>
        <seg-source>
          <mrk mtype="seg" mid="1">
            <x id="3" />Pasadena, California’s iconic Colorado Boulevard <x id="4" />has been the site of the world-famous Tournament of Roses Parade since it began in 1890.
          </mrk>
        </seg-source>
        <target>
          <mrk mtype="seg" mid="1">
            <x id="3" /><x id="4" />Pasadena, Californiens ikoniske Colorado Boulevard har været stedet for den verdensberømte Rose Bowl-parade siden den begyndte i 1890.
          </mrk>
        </target>
      </trans-unit>
    </body>
  </file>
</xliff>

问题在于,最后一步需要解决的是,还有另一种类型的XML,其中trans-unit的起始标签被封装在另一个group元素中,而这个元素在其他XML中不存在。因此,在这里,需要向上跳一个父级并获取前一个trans-unit兄弟节点,就在group之前。

我正在尝试将其构建到同一个LINQ表达式中,以处理这两种情况。

实际上,如果我将第6行修改为以下内容,那么它就可以工作:

.Select(item => (XElement)item.Parent.Parent.Parent.PreviousNode)
<!--                                        ^------ additional Parent --> 

这里是另一个XML,目前使用上述代码会抛出异常,但实际应该返回"0"

<?xml version="1.0" encoding="utf-8"?>
<xliff xmlns:sdl="http://sdl.com/FileTypes/SdlXliff/1.0" xmlns="urn:oasis:names:tc:xliff:document:1.2" version="1.2" sdl:version="1.0">
  <file original="Internet_Anti-DrugIntro2015.xml_1457007.xlf" datatype="x-sdlfilterframework2" source-language="en-US" target-language="hu-HU">
    <body>
      <trans-unit translate="no" id="c3a13bfb-ed51-49cf-8278-e2c86c2114c0">
        <source>
          <x id="0"/>
        </source>
      </trans-unit>
      <group>
        <sdl:cxts>
          <sdl:cxt id="1"/>
        </sdl:cxts>
        <trans-unit id="3b4520df-4483-4c9e-8a9b-ce2544269f3e">
          <source>
            <x id="1"/>
          </source>
          <seg-source>
            <mrk mtype="seg" mid="2">
              <x id="1"/>Drugs are robbing our children of their future.
            </mrk>
            <mrk mtype="seg" mid="3">
              <x id="2"/>Every 17 seconds a teenager experiments with an illicit drug for the first time.
            </mrk>
          </seg-source>
          <target>
            <mrk mtype="seg" mid="2">
              <x id="1"/>A drogok megfosztják gyermekeinket a jövőjüktől.
            </mrk>
            <mrk mtype="seg" mid="3">
              <x id="2"/>17 másodpercenként egy újabb tizenéves próbálja ki először a kábítószereket.
            </mrk>
          </target>
        </trans-unit>
      </group>
      <trans-unit translate="no" id="7890462c-edcb-4fe6-9192-033ba76d9942">
        <source>
          <x id="183"/>
        </source>
      </trans-unit>
    </body>
  </file>
</xliff>

我将非常感激您的任何帮助。


尝试这样写: .Where(itema => (itema != null) && (itemb.Elements(xmlns + "x") != null) ) - jdweng
@jdweng -- 我猜你的意思是 itema 而不是 itemb,因为后者在作用域中不存在。虽然这可以防止异常,但它并没有像应该返回“0”那样。 - ib11
1个回答

2

不要根据XML结构多次使用Parent来导航到XML树上方,而是尝试使用Ancestors().Last()查找名为"trans-unit""group"的最高级别祖先,然后导航到前一个节点。

请尝试替换这部分内容:

.Select(item => (XElement) item.Parent.Parent.PreviousNode)

使用这个:

.Select(item => (XElement)item.Ancestors()
                              .Last(o => new[]{"trans-unit","group"}.Contains(o.Name.LocalName))
                              .PreviousNode)

好的,谢谢。我尝试了这个(new[]{"trans-unit","group"}new[]{"group","trans-unit"}),但在下一行的.Where(item => item != null)中,item的值是<sdl:cxts>,它在group下面,所以似乎第一个trans-unit被视为匹配项,然后匹配它的PreviousNode,而不是向上到group,然后匹配那个的PreviousNode - ib11
1
@ib11 不好意思,我以为一次只能存在 trans-unitgroup 中的一个,没注意到 group 实际上是 trans-unit 的父级。在这种情况下,请尝试使用 Last() 而不是 First() - har07

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接