在iText中访问OpenType字形变体

Question

在iText中访问OpenType字形变体

27

在使用iText构建OpenType字体的PDF文档时，我想从字体内部访问字形变体，特别是制表符数字。由于OpenType字形变体没有Unicode索引，我不确定如何指定要使用特定的变体集（制表符数字）或按其字形ID调用特定的字形。只是寻找相关的iText类名称，如果存在的话。

- Michael Gurney

1

也许值得一看Class GlyphSubstitutionTableReader。它使用OpenTypeFontTableReader，但是乍一看，似乎你必须事先知道要读取哪个表格。（仍然不太清楚您可以用获取的原始“字形”做什么。） - Jongware

这对你有帮助吗？GlyphList类有一个静态方法：String unicodeToName(int) [http://developers.itextpdf.com/reference/com.itextpdf.text.pdf.GlyphList] - J. V. A.

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- nolexa · Accepted Answer

在最新的标签5.5.8和iText的主代码分支中，似乎都不可能实现。

正如本文和微软的OpenType字体文件规范所解释的那样，字形变体存储在字体文件的Glyph Substitution Table (GSUB)中。要访问字形变体需要从文件中读取此表格，这实际上是在类com.itextpdf.text.pdf.fonts.otf.GlyphSubstitutionTableReader中实现的，尽管目前该类被禁用。

类com.itextpdf.text.pdf.TrueTypeFontUnicode中的调用readGsubTable()被注释掉了。

void process(byte ttfAfm[], boolean preload) throws DocumentException, IOException {
    super.process(ttfAfm, preload);
    //readGsubTable();
}

事实证明，这行代码被禁用是有原因的，因为如果您尝试激活它，代码实际上不起作用。

因此，不幸的是，没有办法使用字形变体，因为替换信息从字体文件中永远不会加载。

更新

最初的答案是关于使用iText API直接访问字形变体的可能性，目前还不存在。但是，低级代码已经就位，可以通过一些黑客技巧来访问字形替换映射表。

当调用read()时，GlyphSubstitutionTableReader读取GSUB表，并将所有特征的替换展开到一个地图Map<Integer, List<Integer>> rawLigatureSubstitutionMap中。特征的符号名称当前由OpenTypeFontTableReader丢弃。 rawLigatureSubstitutionMap将glyphId变体映射到基本glyphId，或将连字glyphId映射到glyphIds序列，如下所示：

629 -> 66 // a.feature -> a
715 -> 71, 71, 77 // ffl ligature

通过反向映射可以获得所有基础字形 glyphId 的所有变体。因此，通过它们与基础字形或一系列字形的关联，可以找出所有具有未知Unicode值的扩展字形。

接下来，为了能够将字形写入PDF，我们需要知道该 glyphId 对应的Unicode值。在 TrueTypeFont 中，cmap31 字段映射了一个关系 unicode -> glyphId。反向映射可以通过glyphId得到Unicode值。

调整

GlyphSubstitutionTableReader 中无法访问 rawLigatureSubstitutionMap，因为它是一个 private 成员，没有 getter 方法。最简单的方法是复制原始类并添加映射表的getter方法：

public class HackedGlyphSubstitutionTableReader extends OpenTypeFontTableReader {

    // copy-pasted code ...

    public Map<Integer, List<Integer>> getRawSubstitutionMap() {
        return rawLigatureSubstitutionMap;
    }
}

下一个问题是GlyphSubstitutionTableReader需要TrueTypeFont类的protected HashMap<String, int[]> tables中存储的GSUB表的偏移量信息。将一个辅助类放到同一个包中，可以访问TrueTypeFont的受保护成员。

package com.itextpdf.text.pdf;

import com.itextpdf.text.pdf.fonts.otf.FontReadingException;
import java.io.IOException;
import java.util.List;
import java.util.Map;

public class GsubHelper {
    private Map<Integer, List<Integer>> rawSubstitutionMap;

    public GsubHelper(TrueTypeFont font) {
        // get tables offsets from the font instance
        Map<String, int[]> tables = font.tables;
        if (tables.get("GSUB") != null) {
            HackedGlyphSubstitutionTableReader gsubReader;
            try {
                gsubReader = new HackedGlyphSubstitutionTableReader(
                        font.rf, tables.get("GSUB")[0], glyphToCharacterMap, font.glyphWidthsByIndex);
                gsubReader.read();
            } catch (IOException | FontReadingException e) {
                throw new IllegalStateException(e.getMessage());
            }
            rawSubstitutionMap = gsubReader.getRawSubstitutionMap();
        }
    }

    /** Returns a glyphId substitution map
     */
    public Map<Integer, List<Integer>> getRawSubstitutionMap() {
        return rawSubstitutionMap;
    }
}

扩展 TrueTypeFont 或许更好，但这与 BaseFont 的工厂方法 createFont() 不兼容，因为在创建字体时依赖硬编码的类名。