卢森堡希伯来语分析器

30

有人知道是否存在吗?

我已经谷歌搜索了几个月……

谢谢。


1
是时候开源社区开始制作一个了。在我看来,真正的词干提取非常困难,需要大量的人力,但一些基本的词干提取是可能的,也许一个最小的词干提取器比没有词干提取更好。我可能会自己开始着手处理这个问题。如果有人感兴趣,请与我联系。 - Asaf Bartov
作为第一步,我将尝试使用hspell(3)的枚举。它实际上是一个准备好的词干提取器! - Asaf Bartov
2个回答

22

更新
HebMorph

出于对您问题的好奇,我联系了Itamar Syn-Hershko,他在一年前活跃在Lucene邮件列表上,当时他正在为Lucene工作的希伯来分析器上工作。我问他是否完成了他的分析器。以下是他回应中的一些相关内容:

长话短说,不,我没有。可以确定的是,目前没有像样的免费或开源的希伯来分析器适用于Lucene。我不确定你对这个主题的背景,但请相信我说,这并不容易;这也许还是Lucene不适合希伯来搜索,但我同意必须给出一个解决方案。诚然,索引和搜索希伯来文本的最安全方法是使用专门的词干提取器,即使在此之后与Lucene的集成也不是很容易。市场上有几种非常好的希伯来搜索解决方案,其中只有一种是在其核心中使用Lucene的;我最近尝试联系他们,但还没有得到回复...

所提到的基于Lucene的商业产品名为ATTIVIO,ATTIVIO网站声称有希伯来支持。在SIGTRS(希伯来文本检索兴趣小组)上,一些关于ATTIVIO的讨论声称它是基于Lucene的。

因此,显然可以为Lucene创建一个像样的希伯来分析器,但目前没有可用的免费分析器。


5
你好,我终于有时间开始做一个项目了,迄今为止看起来很有前途。参见:http://www.code972.com/blog/hebmorph/。Itamar。 - synhershko

0

dtsearch有一个名为“pensim”的希伯来语词根插件。看起来是由"wizcomtech.com"开发的。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接