.NET XmlDocument:为什么Save后DOCTYPE会改变?

3
我正在使用.NET XmlReader打开一个XML文件,并将文件保存为另一个文件名。似乎两个文件之间的DOCTYPE声明发生了改变。虽然新保存的文件仍然是有效的XML,但我想知道为什么它要改变原始标记。
Dim oXmlSettings As Xml.XmlReaderSettings = New Xml.XmlReaderSettings()
oXmlSettings.XmlResolver = Nothing
oXmlSettings.CheckCharacters = False
oXmlSettings.ProhibitDtd = False
oXmlSettings.IgnoreWhitespace = True

Dim oXmlDoc As XmlReader = XmlReader.Create(pathToOriginalXml, oXmlSettings)
Dim oDoc As XmlDocument = New XmlDocument()
oDoc.Load(oXmlDoc)
oDoc.Save(pathToNewXml)

以下是原始文档内容:

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML Basic 1.1//EN" "http://www.w3.org/TR/xhtml-basic/xhtml-basic11.dtd">

变成(注意末尾的 [ ] 字符):
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML Basic 1.1//EN" "http://www.w3.org/TR/xhtml-basic/xhtml-basic11.dtd"[]>
3个回答

8

如果您将XmlDocument.XmlResolver设置为null,System.Xml中会出现一个bug。解决方法是创建自定义的XmlTextWriter:

    private class NullSubsetXmlTextWriter : XmlTextWriter
    {
        public NullSubsetXmlTextWriter(String inputFileName, Encoding encoding)
            : base(inputFileName, encoding)
        {
        }
        public override void WriteDocType(string name, string pubid, string sysid, string subset)
        {
            if (subset == String.Empty)
            {
                subset = null;
            }
            base.WriteDocType(name, pubid, sysid, subset);
        }
    }

在您的代码中,创建一个新的NullSubsetXmlTextWriter(pathToNewXml, Encoding.UTF8)对象,并将该对象传递给oDoc.Save()方法。
这里是Microsoft支持案例,您可以在其中阅读有关解决方法的信息(它描述了解决方法,但不提供代码)。

+1 是因为这个方法可行。但是它会导致我的 HTML/XML 格式变得奇怪且难以阅读。另一个选择是使用这个答案,它可以在不影响文档格式的情况下工作:https://dev59.com/NWjWa4cB1Zd3GeqPpElu#16451790。 - Bob Horn

1

可能该库将DOCTYPE元素解析为内部结构,然后将结构转换回文本。它不会存储原始字符串形式。


0

这是最适合您的解决方案:

writer.WriteDocType("Name", Nothing, 
                    "http://xml.cxml.org/schemas/cXML/1.2.033/Fulfill.dtd", Nothing) 

如果你使用Nothing,你将不会得到[]或""等内容


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接