有没有人知道一个解析器可以将维基格式的文本作为输入,并生成一个实体树,就像XML解析器生成实体树一样?为了澄清,我正在寻找的是可以处理以下文本的工具:
-Intro-
Textual stuff in ''italics''
--Subhead--
Yet more text
我希望能够创建一个以Intro为根的树,有三个子节点中的一个(Subhead)本身就有一个子节点。我正在寻找一些能够理解“简单”的wiki格式的工具,这个格式描述在http://meta.wikimedia.org/wiki/Help:Wikitext上。
我知道有几种用于Wiki文本的词法分析器,但没有树形分析器。我正在寻找一些开源的、用C或C++编写的工具。