自然语言处理-真实大小写分类器

6
请推荐一个适用于数据集正确大小写化的良好机器学习分类器。此外,是否可以在这种分类器中指定自己的规则/特征进行正确大小写化? 感谢您的所有建议。谢谢。
2个回答

3
我在Python中实现了一个真实化器的版本。只要您提供足够的数据(即正确大小写的句子),它就可以针对任何语言进行训练。
对于英语,它在来自维基百科的示例句子上实现了98.38%的准确性。已经提供了英语的预训练模型。
您可以在此处找到它: https://github.com/nreimers/truecaser

鼓励提供外部资源的链接,但请在链接周围添加上下文,以便其他用户了解它是什么以及为什么存在。始终引用重要链接的最相关部分,以防目标站点无法访问或永久离线。来自如何回答 - Gustavo Morales

0

你知道实现可以在哪里找到吗? - Alexey Grigorev

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接