使用Java从网页中提取RDF

Question

3

我希望能够用Java从网页中提取嵌入式Web语义（RDF），并形成相应的XML。如有任何建议或帮助，将不胜感激。

例如，如果网页中有关于“Movie”类型的RDF实现，我想要形成一个XML，其中包含一个Movie标签以及它当前的属性值，如startTime等。

目前，我能够使用Apache Jena API从数据库中提取数据并从Resultset形成XML。但是，我不知道如何从网页中提取相同的数据。

- Ani

我建议您编辑您的问题，添加此评论并删除您的评论。这样更容易理解您在问什么以及当前情况。 - gabriel

所以你想将RDFa转换为RDF/XML？我猜大多数RDF工具都能处理这个。你可以在[softwarerecs.se]上寻求工具推荐。 - unor

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- William Greenly · Answer 1

如果您想使用软件即服务，那么Any23可以将一些HTML转换为RDF。如果您想从中创建SPARQL结果集，然后加载到Jena模型中并运行查询。

或者，如果您不想使用SaaS从HTML / RDFa提取RDF，则可以查看Shellac。它与Jena配合使用，并包括CLI。