RFCs(http://www.ietf.org/rfc.html)通常以文本文件的形式发布。
- 是否有其他格式可以使解析RFC内容更容易?
- 是否有用于广泛使用的RFC文本文档的解析器?
RFCs(http://www.ietf.org/rfc.html)通常以文本文件的形式发布。
在http://xml.resource.org/public/rfc/xml/,提供有限数量的RFC XML版本。
此外,您还可以使用http://xml.resource.org/public/rfc/bibxml/中的Bib XML合并文本数据。
IETF维护了最少标记的HTML RFC,例如:
https://www.rfc-editor.org/rfc/rfc2616.html
但是标记主要由锚点组成,以实现目录;并且主体标记大多是<pre> ... </pre>。尽管如此,对这些RFC进行一些有意义的解析可能是可行的。
W3C有一些HTML化的RFC,例如:
http://www.w3.org/Protocols/rfc2616/rfc2616.html
其中标记在语义上更为丰富,因此可能更易于解析。