我有很多使用docutils转换为HTML的RST(reStructuredText)文件。
使用一个小型开发的JS应用程序(基本的带有HTML5 contenteditable属性的iframe),非技术人员可以轻松地编辑生成的HTML页面。目标是将在HTML中进行的修改应用回原始的RST文件。
我想知道是否有一种方法可以通过原始_RST->输出_HTML转换的ground-truth来训练算法,以便我们稍后可以将输出_HTML + 微小修改反向转换为RST?这将是什么样的算法?我应该从哪里开始挖掘?
为了简化问题,我也可以使用docutils的内部XML AST表示作为文档输入(RST到XML-AST:http://docutils.sourceforge.net/tools/quicktest.py),然后修复xml2rst+xslt项目(http://www.merten-home.de/FreeSoftware/xml2rst/)
欢迎任何建议。