有没有开源的离线翻译工具?

6
我正在寻找一款离线、开源的翻译器/API,翻译质量不需要很高,只需要足够分析关键词。我正在编写一个Firefox插件,该插件计算网站是垃圾站点的概率,类似于垃圾邮件过滤器,通过计数“恶意”单词来实现。它可以处理英语,但我是德国人,德语对计算机来说更难。我的想法是通过将其翻译成英语来“简化”语言,并分析英文文本。曾经有Google Translate API,但现在你必须付费。我知道还有其他程序可以翻译网站:https://stackoverflow.com/questions/6151668/alternative-to-google-translate-api。它们都有一个问题。你向服务器发送网站的HTML代码,服务器为你翻译文本并将其发送回来。这会增加流量和减慢速度。服务器所有者也不会喜欢你。 因此,我正在寻找一种离线、开源的翻译器。翻译质量不需要很好,只需要足够分析关键词。仅使用字典逐字翻译是行不通的。例如:'Ich bringe Dich um' 的意思是 'I kill you'。如果逐字翻译,你会得到:'I bring you around.' 这种翻译听起来很奇怪,但并不邪恶。问题在于 'bringe...um' 只是一个单词。我想避免使用德语,因为会有像这样的麻烦问题(而且还有更多的问题:23个不同的复数规则等)。我认为发明自动翻译的程序员已经面对并解决了这些问题。

我从事翻译业务。自动翻译是一项非常复杂的任务。我不知道有任何合理的离线翻译引擎可以集成到您的代码中。 - Remy
1个回答

2

如果你正在寻找解决方案,Apache Joshua (Incubating) Home可能会帮到你。

你只需下载想要的语言包并将其作为服务器运行。正如他们所说:

一个关键特点是没有依赖项(除了Java 8)。在自己的机器上运行机器翻译系统就像下载tarball、解压缩它并运行包含的shell脚本那样容易。

接下来你只需要进行网络查询以获取翻译(localhost:5674/translate?meta=list_weights&q=cifra+inferior+a+lo+que+predec%C3%ADan+las+encuestas+%2C+que+pronosticaban+de+mas+del+60+%25+de+participaci%C3%B3n+electoral+.&q=yo+quiero+taco+bell),然后你将得到JSON格式的翻译响应。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接