例如:
gegessen -> essen
wurde [...] gefasst -> fassen
Häuser -> Haus
Hunde -> Hund
我的愿望清单:
- 它必须适用于名词和动词。
- 我知道这是一个非常困难的任务,考虑到德语的复杂性,因此我也在寻找提供近似或可能只有80%准确性的库。
- 我更喜欢不使用字典的库,但考虑到情况,我也可以做出妥协。
- 我也更喜欢C/C++/Delphi Windows库,因为这样更容易集成,但.NET、Java等也可以。
- 它必须是免费的库。 (L)GPL, MPL, ...
编辑:我知道没有办法在没有任何字典的情况下进行形态分析,因为存在不规则单词。 当我说我更喜欢没有字典的库时,我指的是那些完整的字典,它们映射每个单词:
arbeite -> arbeiten
arbeitest -> arbeiten
arbeitet -> arbeiten
arbeitete -> arbeiten
arbeitetest -> arbeiten
arbeiteten -> arbeiten
arbeitetet -> arbeiten
gearbeitet -> arbeiten
arbeite -> arbeiten
...
那些词典有一些缺点,包括庞大的体积和无法处理未知单词。
当然,所有的例外情况都只能通过词典来处理:
esse -> essen
isst -> essen
eßt -> essen
aß -> essen
aßt -> essen
aßen -> essen
...
(我现在头脑转得飞快 :))