TeX断字模式:它们代表什么?

13

如果您向下滚动此页面,您将看到英式英语断字模式,例如:

\patterns{ % just type <return> if you're not using INITEX
.ab4i
.ab3ol
.ace4
.acet3
.ach4
.ac5tiva

这些像.ab4i的模式是什么意思?


1
我只是猜测,但我想这些数字是基于周围字母来选择断词位置的优先级系统。唯一的问题是:该系统更喜欢高值还是低值? - dmckee --- ex-moderator kitten
2个回答

17
TeX连字符模式中有三种字符。点.是单词边界的锚点。字母代表它本身,即要连字符的单词中的字母。数字代表潜在的连字符点,并且数字表示连字符级别。总共有五个级别。
算法的基本思想是将单词与这些模式进行匹配,并插入每个匹配模式的连字符级别。如果两个不同模式的两个级别在同一点匹配,则选择较高的那个。对于最终值,只有奇数级别表示允许的连字符点。这样做的目的是能够指定可能的连字符点和不应插入连字符的位置。因此,例如,如果单词中的特定位置与具有1和2的两个模式相匹配,则不允许在该点处插入连字符,因为2会覆盖1,只有奇数值表示允许的连字符点。
查看您的示例,.ab4i表示单词开头的abi很少在bi之间接收连字符,因为偶数的4级将抑制连字符,除非被5级覆盖。另一方面,以activa开头的单词始终可以在ct之间插入连字符,因为5级将覆盖任何其他值,并且作为奇数允许连字符。

@jk:感谢你详细的解释。但是我不太明白这部分的意思:“在最终的数值中,只有奇数级别表示允许使用连字符的位置。” - understack
@understack:奇数值表示建议使用连字符的位置,偶数值表示不建议使用连字符的位置。由于算法可能会发现多个模式适用,因此它有一个优先级系统来确定哪个连字符规则更重要,这由更高的数字表示。 - Charles Stewart

4
这些模式是使用名为patgen2的工具创建的。有关此工具的教程的TeX源代码可在patgen2.tutorial中找到,并且可以通过tug.org获取有关此主题的博士论文。

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接