我有N份Microsoft Office 2003的Word文档,想把这些文档按照一定顺序合并成一个单独的Word文档。请问如何使用Ruby完成此操作?谢谢!
这些文档只是在Microsoft Office中创建的,我不使用Windows系统,希望能够使用非Windows系统的解决方案。
编辑:如果这些文档是odt格式而不是doc格式,那么这个过程会容易一些吗?
我有N份Microsoft Office 2003的Word文档,想把这些文档按照一定顺序合并成一个单独的Word文档。请问如何使用Ruby完成此操作?谢谢!
这些文档只是在Microsoft Office中创建的,我不使用Windows系统,希望能够使用非Windows系统的解决方案。
编辑:如果这些文档是odt格式而不是doc格式,那么这个过程会容易一些吗?
在http://rubyonwindows.blogspot.com/search/label/word上有一系列关于Word和Ruby的非常好的文章。Word文件非常复杂,至少在2007年之前是这样的,因此最好自动化Word来完成它。
Selection.InsertFile
插入尽可能多的文档。理解,几乎任何对这个问题的回答都将取决于您使用的文档文件的限制...
话虽如此,在我看来,如果您要这样做,第一选择应该是将它们转换为更容易解析的格式 - RTF 是一个很好的例子,如果您可以将它们转换为这种格式,O Reilly 的 RTF Pocket Guide 是一个了解文件结构的绝佳资源。如果您能在Linux机器上安装AbiWord,转换文件非常简单。从命令行运行:
abiword --to=rtf some_file_name.doc
abiword --to=txt some_file_name.doc
这很简单,它只会分割文本,然后您可以将其连接起来并完成。但是,您将失去任何格式的全部格式。