如何在PowerShell中使用XmlReader流式传输大型/XML文件?

7

我有一个几千兆字节的XML文件。XML中没有空格。

于是我写了一小段C#代码来将其拆分成单个文件(其中还包含一些额外的代码,例如在测试时进行随机化等操作)。

using (XmlReader MyReader = XmlReader.Create(@"d:\xml\test.xml"))
            {
                while (MyReader.Read())
                {
                    switch (MyReader.NodeType)
                    {
                        case XmlNodeType.Element:
                            if (MyReader.Name == "Customer")
                            {
                                XElement el = XElement.ReadFrom(MyReader) as XElement;
                                if (el != null)
                                {
                                    custNumber = (string)el.Element("CustNumber");
                                    output = @"d:\xml\output\" + custNumber;

                                    File.WriteAllText(output, el.ToString());
                                }                                    
                            }
                            break;
                    }
                }
            }

我使用PowerShell解析生成的文件,主要是因为我发现在服务器上使用它更容易,而且可以在规格变化时即时更改脚本。

那么...将上述内容转换为PowerShell的最简单方法是什么?需要在每个命令前加上[.Net]吗?如果一行中有"<cust",下一行中有"omer>",我是否需要逐字节读取?

1个回答

11

这应该非常接近您在 Powershell 中想要执行的操作:

$f = [System.Xml.XmlReader]::create("d:\xml\test.xml")

while ($f.read())
{
    switch ($f.NodeType)
    {
        ([System.Xml.XmlNodeType]::Element) # Make sure to put this between brackets
        {
            if ($f.Name -eq "Customer")
            {
                $e = [System.Xml.Linq.XElement]::ReadFrom($f)

                if ($e -ne $null)
                {
                    $custNumber = [string] $e.Element("CustNumber")

                    $e.ToString() | Out-File -Append -FilePath ("d:\xml\output\"+$e.ToString())
                }
            }
            break
        }
    }
}

不得不将开关移动到if ($f.NodeType -eq [Syste,,,),有趣的是在PowerShell中必须使用元素的.Value,与C#相反。 - edelwater
1
@edelwater:在 switch 选项周围添加括号解决了它。 - Wouter

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接