我正在处理一个应用程序,该应用程序接受不同语言的用户输入(目前固定为3种语言)。要求是用户可以输入文本,而不必通过 UI 中提供的复选框选择语言。
是否有现有的Java库来检测文本的语言?
我想要这样的东西:
text = "To be or not to be thats the question."
// returns ISO 639 Alpha-2 code
language = detect(text);
print(language);
结果:
EN
我不想知道如何自己创建语言检测器(我已经看过很多尝试这样做的博客)。这个库应该提供一个简单的API,而且完全离线可用。是否开源或商业闭源都无所谓。
我在SO上也发现了这些问题(还有更多):