我们可以使用Yolo来检测和识别图像中的文本吗?

18

目前我正在使用一种名为"Yolov2"的深度学习模型进行物体检测,并希望将其用于提取文本并保存到磁盘中,但我不知道如何操作。如果有人了解更多信息,请给予建议。

我使用的是Tensorflow。

谢谢。


你的模型是用于目标检测训练的,但你想要用它来提取文本?这两者似乎不兼容。你能详细解释一下你想做什么吗? - vega
事实上,我想要做的是从图像中提取对象,并且如果某些图像带有特殊标签“例如车牌”,我想要取出该对象并提取显示在上面的文本。我该如何做到这一点? - Kamel BOUYACOUB
嗨@KamelBOUYACOUB,您是否尝试使用围绕单词的边界框训练图像以检测测试图像中相似的书写单词(字体方面)?我们还尝试使用YOLO darknet从表格中提取用户手写数据。对于测试图像中的同一用户手写数据,如果图像具有不同的颜色强度,则效果良好,但如果图像旋转,则效果不佳。我们使用了预训练的yolo.cfg模型的darket权重。请分享您的发现。 - donald
@donald,请问您能否分享有关从表格中提取手写文本的工作的更多信息? - eric2323223
@donald,你能分享一下从表格中提取文本的方法吗? - Eliyaz KL
2个回答

21

如果使用预训练模型,您需要保存这些输出并将图像输入到字符识别网络中,如果是使用神经网络或其他方法。

您正在进行的是“场景文本识别”。您可以查看卷积神经网络在野外读取文本的论文,这里有一个演示主页。Github用户chongyangtao列出了整个主题的资源列表。


3

我有一个类似的问题,正在使用SVHN数据集制作数字检测模型。这还不是一个完成的项目,但似乎效果不错。您可以在Yolo-digit-detector查看代码。


4
S/O回顾:@penny请尽量详细解释您的答案。简单发布链接没有增加价值,也不允许在S/O上这样做。我应该将其标记为“不是答案”,但我认为您可能有一些有价值的内容需要分享!始终尝试尽可能全面,并确保您的答案实际包含问题的答案。与问题相关的代码示例将非常有益。 - Jonny Asmar

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接