使用Python验证HTML/RDFa

3

如何编写一个可以验证HTML和嵌入式RDFa的Python模块是最佳方法?我熟悉validator.w3.org,并且有兴趣编写自定义验证器,执行类似于使用RDFa进行元素元数据的不同标准的相似功能。有哪些好的源代码可以查看,Python库可以尝试,需要注意什么?

1个回答

2

Emmett,

我不确定你想要实现什么。我曾经用Python编写了一个RDFa蒸馏器。你需要先问自己是否考虑XHTML或HTML5。如果是前者,有许多XML环境和用于RDFa使用的DTD可供使用。这可能有效。对于HTML5,您可能希望使用Python中的HTML5解析器,但它并不“知道”RDFa,但它可以生成DOM树(或其他表示),然后您可以使用它来检查RDFa属性。但请注意,HTML5解析器不执行“验证”,即分析HTML5代码以获取各种可能的错误条件;它只是根据HTML5规范生成DOM树。

希望这可以帮到你。

祝好

Ivan


参考代码,RDFa蒸馏器代码托管在Github上:https://github.com/RDFLib/pyrdfa3 - scor
非常感谢Ivan,我以前使用过html5lib,但是它缺乏文档有点让人烦恼,但它可能正是我需要的。RDFa蒸馏器看起来也很不错。 - Emmett Butler

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接