将HTML导入到Adobe Indesign

18
我们目前正在工作中将一份报纸制作成PDF版本,我们有一个.NET网站来捕捉文章以便发布,存储输入的内容为HTML格式,这样我们就可以保持粗体、下划线和删除线等样式。
一旦存储在数据库中,我们计划使用Indesign来创建PDF。我们目前已经建立了一个模板,但是当我们生成一个XML文档并导入到Indesign中时,HTML标记只是被写出来。是否有方法可以绕过此问题,让Indesign保持标签与HTML中一致?我们只需要一些简单的标记,如加粗,删除线,下划线和居中对齐。
谢谢。

参见这个类似的问题 - Peter Krauss
7个回答

6

Pandoc现在支持将文档导出为ICML格式(Adobe InCopy可以“嵌入”InDesign文档的XML格式)。要将HTML转换为ICML:

pandoc --standalone -o output.icml input.html

请参阅pandoc维基中的“在InDesign中导入Markdown”,以获取有关工作流程的详细信息。

1
这是最好的答案! pandoc 是获得与丑陋的 .icml(Indesign XML 靠近 W3C 的 XHTML+CSS 开放格式生态系统)初次接触的最佳途径。我们无需使用 InDesign来生成(高质量)PDF 自动化内容... 参见 https://print-css.rocks/。 - Peter Krauss

5
您需要将HTML标签转换为字符样式,并在导入时将其应用于XML。需要注意的是,与HTML不同,字符样式无法嵌套应用,因此您需要为可能出现的每种组合设置一个字符样式。或者,您可以使用脚本将样式应用于特定文本运行。

项目小组最终做了类似于这样的事情。他们打开了idml文件,其中包含xml文件,然后将html转换为字符样式并重新创建所需的xml文件,然后将其打包回idml文件中,这样InDesign就可以打开它了。 - Paritosh

1
我们在直接将xml导入InDesign时遇到了一些不好的经历。
如果您仍然遇到这个问题,请查看开源的Ickmull代码库。它可以将xhtml文件转换为idml文件,然后可以在InDesign中打开。这可能是更适合您的Web to Print工作流程。

http://code.google.com/p/ickmull/


1

Adobe产品是"封闭的",不能普遍支持标准格式(例如导入XHTML)。

如何抗议Adobe?!

最大的问题出现在我们有很多文件时...


批处理方案(大量文章)

...目前(2013年),我唯一可用的方法是这个(半自动)步骤:

  1. [手动,准备] 检查我的InDesign“模板”文件,它将作为“导入者”使用:带有易读名称样式必须被定义。PS:它们都在HTML + CSS导出中可见(列出)。
  2. [手动,准备] 适应我的(X)HTML文件,用CSS 类名表示所有相关样式(不能使用样式属性或奇怪的类名);
  3. [自动,批处理] 使用Python OpenDocument Converter 自动将所有(X)HTML文件转换为DOC。
  4. [InDesign辅助,最终处理] 从InDesign克隆的“模板”文件(项目1)中导入每个DOC。 InDesign样式将自动转换类(项目2)。
这个过程比IDML更好,因为直接使用XHTML作为InDesign的内容源。虽然不是所有应用程序都完美适用,但避免了使用非标准转换的IDML,避免了学习IDML和IDML的限制,并避免了IDML错误的风险...所以,我认为比尝试IDML过程更快。
另一种更好的方法是准备一个直接将XML转换为DOCXRFT的XSLT,因为它允许表达脚注等内容...您是否有此类过程的链接或线索?

InDesign拥有地球上最好的可扩展性层之一,而IDML格式是XML。这似乎不是抱怨“封闭”标准的好目标。有一个开放的格式(IDML),只是二进制格式(INDD)执行速度更快。您仍然可以创建和编辑IDML(就像您可以使用DOCX一样)并打开它。 - Justin Putney

1

1

0

这是一个老问题,但问题可能是永恒的。

这里有一种简单的实用技巧。它可能不完全适合自动化工作流程,但非常适合偶尔使用。

  1. 复制HTML代码,例如从浏览器的源视图中。省略头部、CSS、菜单等,只复制可能被包含在一系列div、section或其他容器标记中的相关内容。

  2. 粘贴到一个纯文本文档中(Windows上的记事本,Mac上的TextEdit),并将其另存为带有.html扩展名的纯文本文件。

  3. 使用LibreOffice打开HTML文件。我尝试过4和6版本,它们都可以很好地解析HTML。您将获得一个带有段落样式(如标题)和字符样式(如粗体和斜体)的文档。可选择全部并将字体更改为Times New Roman。另存为.docx文件或其他文件类型。

  4. 使用保留样式和格式以及自动导入样式选项将其导入InDesign。您将获得一个带有段落样式和字符样式的文档,您可以随意编辑。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接