从给定节点中提取子节点数据

Question

从给定节点中提取子节点数据

4

我希望在Java中使用DOM4j来解析XML文件。

以下是一个例子：

<request method="POST" url="/devices/test/planner" body="*">
  <response statusCode="200">
    <header>
      <headerParameters>
        <headerParameter name="Content-Type">
          Content-Type=application/xml
        </headerParameter>
      </headerParameters>
    </header>
    <body>booking created!</body>
  </response>
</request>

如何提取子节点数据，以给定请求（第一个节点）为例？

例如获取<response>状态码或<headerParameter>名称属性？

- Michael A

2个回答

2

使用dom4j从给定节点中提取子节点数据：

1. 将以下Java代码放入名为Main.java的文件中：

import java.util.*;
import java.io.*;
import org.dom4j.*;
import org.dom4j.io.*;

class Foo{
    String moo;
    String baz;
}
class Main{
    public static Document parse(String filePath) throws DocumentException {
        SAXReader reader = new SAXReader();
        Document document = reader.read(filePath);
        return document;
    }
    public static void main(String[] args){
        try{
            File f = new File("/tmp/myxml.xml");
            Document document = parse(f.toString());    
            List list = document.selectNodes("//penguins/PieHole");
            Foo foo = new Foo();
            Iterator iter=list.iterator();

            while(iter.hasNext()){
                Element element=(Element)iter.next();
                foo.moo = element.selectSingleNode("cupcake").getText();
                foo.baz = element.selectSingleNode("montana").getText();
            }
            System.out.println("foo.moo: " + foo.moo);
            System.out.println("foo.baz: " + foo.baz);
        }
        catch(Exception e){
            e.printStackTrace();
        }
        System.out.println("done");
    }
}

2. 把这段代码放进一个名为 /tmp/myxml.xml 的文件中：

<?xml version="1.0" encoding="utf-8"?>
<penguins>
  <mars>129</mars>
  <PieHole>
    <cupcake>value inside cupcake</cupcake>
    <montana>value inside montana</montana>
  </PieHole>
</penguins>

2. 把这些 jar 文件放在一个名为 lib 的目录中，该目录与 Main.java 文件在同一目录中：

dom4j-1.6.1.jar  
jaxen-1.1.1.jar

3. 编译程序并从终端运行：

javac -cp .:./lib/* Main.java
java -cp .:./lib/* Main

4. 解读输出结果：

eric@defiant ~/code/java/run04 $ javac -cp .:./lib/* Main.java
eric@defiant ~/code/java/run04 $ java -cp .:./lib/* Main
foo.moo: value inside cupcake
foo.baz: value inside montana
done

5. 发生了什么？

这段代码使用的是Java 1.7.0版本，并且引用了dom4j 1.6.1库和jaxen 1.1.1支持库。它导入了用户创建的XML文档，然后使用SAXReader将其解析为Document类型。它使用selectNodes(string)方法获取PieHole xml标签。对于每个单独的PieHole xml标签，它将获取杯子和蒙大拿标签，并将它们放入Foo类中。最后，它打印出Foo里面的内容。

- Eric Leschinski

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- maerics · Accepted Answer

假设您获得了一个名为“request”的Element，那么您可以像这样操作：

Element response = (Element) request.elements().get(0);
int statusCode = Integer.parseInt(response.attribute("statusCode"));

如果您想递归遍历子元素，则需要编写迭代（或递归）代码来访问由elements()方法返回的列表中的每个元素。

[编辑] 您也可以使用XPath提取您要查找的特定项：

int statusCode = Integer.parseInt(
    request.selectSingleNode("response/@statusCode").getText());
String firstHeaderName =
    request.selectSingleNode(
        "response/headerParameters/headerParameter/@name").getText();