我下载了维基百科的转储文件,我想将Wiki格式转换成我的对象格式。是否有可用的Wiki解析器将对象转换为XML?
我下载了维基百科的转储文件,我想将Wiki格式转换成我的对象格式。是否有可用的Wiki解析器将对象转换为XML?
请查看java-wikipedia-parser。根据文档:
该解析器带有HTML生成器。但是,您可以通过传递自己实现的
be.devijver.wikipedia.Visitor
接口来控制正在生成的输出。
您可以使用各种工具来解析您的内容。所有脚本语言都有模块。 例如,Perl语言有Text::Markup::Trac,它是用于Text::Markup的Trac wiki语法解析器。它会生成一个HTML文件。