使用凸包坐标提取字符 - opencv - python

6

我有这样的字符图像:

使用以下代码,我可以获取轮廓和凸包,然后我可以为每个字符绘制凸包。

import cv2
img = cv2.imread('test.png', -1)

ret, threshed_img = cv2.threshold(cv2.cvtColor(img, cv2.COLOR_BGR2GRAY),
                        127, 255, cv2.THRESH_BINARY)
image, contours, hier = cv2.findContours(threshed_img, cv2.RETR_EXTERNAL,cv2.CHAIN_APPROX_NONE)
for cnt in contours:
    # get convex hull
    hull = cv2.convexHull(cnt)
    cv2.drawContours(img, [hull], -1, (0, 0, 255), 1)
    print(hull)
cv2.imwrite("contours.jpg", img)

结果如下所示: 我可以这样获取船体坐标(对于一个字符):
[[[546 134]]
 [[534 149]]
 [[532 151]]
 [[527 153]]
 [[523 154]]
 [[522 154]]
 [[520 109]]
 [[521 107]]
 [[524 106]]
 [[533 106]]
 [[539 111]]
 [[543 117]]
 [[546 122]]]

现在我想使用convexHull坐标来分离每个字符。 分离后,图像将如下所示: . . .。 我使用convexHull坐标的主要原因是可以分割在垂直图像空间中重叠的字符。 您可以通过使用以下图像来理解我的意思: 因为大多数图像都包含像上面那样的字符,所以我无法准确地分割字符。 所以我想使用convexHull坐标来分割字符。
1个回答

4
  • 在获得一个字符的凸包后,我找到了它对应的轮廓并填充了它。
  • 我将每个单独填充的轮廓与原始图像进行遮罩处理,以获取各个片段。

以下是代码:

import cv2
import numpy as np

img = cv2.imread(r'C:\Users\selwyn77\Desktop\letters.png', -1)
img2 = img.copy()
cv2.imshow("original.jpg", img)

gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

ret, threshed_img = cv2.threshold(gray, 127, 255, cv2.THRESH_BINARY)
image, contours, hier = cv2.findContours(threshed_img, cv2.RETR_EXTERNAL,cv2.CHAIN_APPROX_NONE)

#--- Black image to be used to draw individual convex hull ---
black = np.zeros_like(img)
cv2.imshow("black.jpg", black)

contours = sorted(contours, key=lambda ctr: cv2.boundingRect(ctr)[0]) #added by OP : this sorts contours left to right, so images come in order

for cnt in contours:
    hull = cv2.convexHull(cnt)

    img3 = img.copy()
    black2 = black.copy()

    #--- Here is where I am filling the contour after finding the convex hull ---
    cv2.drawContours(black2, [hull], -1, (255, 255, 255), -1)
    g2 = cv2.cvtColor(black2, cv2.COLOR_BGR2GRAY)
    r, t2 = cv2.threshold(g2, 127, 255, cv2.THRESH_BINARY)
    cv2.imshow("t2.jpg", t2)

    masked = cv2.bitwise_and(img2, img2, mask = t2)    
    cv2.imshow("masked.jpg", masked)

    print(len(hull))
    cv2.waitKey(0)

cv2.destroyAllWindows()

现在您可以使用cv2.imwrite()来保存每个单独的片段。

以下是几个分割字符:

输入图像描述

输入图像描述

输入图像描述


谢谢你的回答。我尝试了这个方法,似乎可以修改并得到我想要的结果。但问题是结果的顺序不正确。对我来说,顺序很重要。你能为此做些什么吗? - Ishara Madhawa
1
@IsharaMadhawa 或许可以通过轮廓的中心来进行排序! - Jeru Luke
@IsharaMadhawa 推荐的代码修改实际上有效吗? - Jeru Luke

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接