如何使用Python中的OpenCV裁剪图像

405

我该如何使用OpenCV裁剪图片,就像之前在PIL中所做的那样。

PIL的工作示例:

im = Image.open('0.png').convert('L')
im = im.crop((1, 1, 98, 33))
im.save('_0.png')

但我应该如何在OpenCV上实现呢?

这是我尝试的方法:

im = cv.imread('0.png', cv.CV_LOAD_IMAGE_GRAYSCALE)
(thresh, im_bw) = cv.threshold(im, 128, 255, cv.THRESH_OTSU)
im = cv.getRectSubPix(im_bw, (98, 33), (1, 1))
cv.imshow('Img', im)
cv.waitKey(0)

但它不起作用。

我认为我错误地使用了getRectSubPix。如果是这种情况,请解释如何正确使用此函数。

12个回答

823

非常简单,使用numpy切片。

import cv2
img = cv2.imread("lenna.png")
crop_img = img[y:y+h, x:x+w]
cv2.imshow("cropped", crop_img)
cv2.waitKey(0)

10
怎样将裁剪后的图像保存到变量中? - Nolik
127
请记住,x和y是颠倒的。我忽略了这一点。 - markroxor
25
如果您已经定义了裁剪边距,则可以执行 crop_img = img[margin:-margin, margin:-margin] 进行裁剪。 - Rufus
74
太好了,只是要注意更改crop_img将会改变img。否则,你应该使用crop_img = img[y:y+h, x:x+w].copy()来裁剪图像。 - user1270710
2
使用x,y来解释这有点混乱,实际上最好使用“axis”来解释。在上面的答案中,y实际上代表第一轴,x代表第二轴,参考基础知识。然后我们可以理解为访问第一轴,然后是第二轴。这与Python、Java或C/C++中的2D数组访问相同。 - Ynjxsjmh
显示剩余7条评论

174
我可以为您翻译。以下是翻译的文本:

我有一个问题,在这里找到了另一个答案:复制感兴趣的区域

如果我们将(0,0)视为图像的左上角,图像名为im,从左到右是x方向,从上到下是y方向。如果我们在该图像中有(x1,y1)作为左上顶点,(x2,y2)作为矩形区域内的右下顶点,则:

roi = im[y1:y2, x1:x2]

这是一个关于NumPy数组索引和切片的综合资源,可以告诉你更多关于裁剪图像等内容。在OpenCV2中,图像将存储为NumPy数组。

:)


1
嗨,根据你的情况,应该是roi = im[y1:y2+1, x1:x2+1]吧?因为numpy使用排除区域来切片。 - Scott Yang
@samkhan13,当我使用这个公式裁剪时,所有的裁剪都具有形状(0,宽度,通道)。也就是说,我根本没有得到y维度。 - mLstudent33
@mLstudent33 可能是图像 im 没有被正确读取,为空。尝试使用带断点的 IDE 逐步诊断您的代码。您可以使用 Google Colab 创建代码块,并在 Stack Overflow Python 聊天室 上分享您的 Jupyter 笔记本以获得帮助。 - samkhan13
@samkhan13,实际上我有一个奇怪的问题,我在Github Opencv Issues上发布了:https://github.com/opencv/opencv/issues/15406 我也会查看聊天记录。谢谢! - mLstudent33

41

这段代码从x=0,y=0剪切图像到h=100,w=200。

import numpy as np
import cv2

image = cv2.imread('download.jpg')
y=0
x=0
h=100
w=200
crop = image[y:y+h, x:x+w]
cv2.imshow('Image', crop)
cv2.waitKey(0) 

@hatami,所以高度是在y = 0的下方100像素,对吗?这是numpy数组的第101行?宽度在x = 0的右侧200像素,对吗? - mLstudent33
2
赞赏您使用可以真正理解的变量名称。 - Spectric

24
请注意,图像切片不是创建裁剪图片的副本,而是创建指向roi指针。如果您要加载很多图像,并使用切片裁剪图像的相关部分,然后将其附加到列表中,则可能会浪费大量内存。
假设您加载了N个图像,每个图像都是>1MP,并且您只需要来自左上角的100x100区域。 切片:
X = []
for i in range(N):
    im = imread('image_i')
    X.append(im[0:100,0:100]) # This will keep all N images in the memory. 
                              # Because they are still used.

或者,您可以通过.copy()复制相关部分,这样垃圾收集器就会删除im

X = []
for i in range(N):
    im = imread('image_i')
    X.append(im[0:100,0:100].copy()) # This will keep only the crops in the memory. 
                                     # im's will be deleted by gc.

在发现这个问题后,我意识到用户1270710曾经提到过其中一个评论,但是我花了很长时间才找到(即调试等)。所以,我认为值得一提。


请看这个链接:https://dev59.com/w-k5XIcBkEYKwwoY3tcY - Abdul Rehman
就占用的内存空间而言,我知道复制感兴趣的区域是最好的选择,但时间消耗呢?如果我使用copy()来复制ROI,与切片相比,结果会如何?此外,如果我有一个变量tmp,我将从计算机加载的每张图片都存储在其中,那么切片对我的内存不应该有不良影响,对吗?您描述的问题仅与在加载所有图像并再次存储它们的ROI时发生的情况有关,同时具有原始图像和ROI。 请让我知道我是否理解正确。 - Cătălina Sîrbu
复制将在我所说的情况下忽略不计。除非您多次复制大型图像,否则不会有时间差异。在我的代码中,每次裁剪的效果将小于1毫秒。问题是,您要么存储大图像和指针(ROI仅为几个字节),要么在内存中存储小图像(在我的情况下)。如果您这样做几次,那就没问题了。但是,如果您这样做数千次,使用切片的内存使用量将变得非常高。如果您使用切片,则在加载几千张图像后填充整个内存。而我的代码仍将按MB的顺序运行。 - smttsp

8

使用opencv的复制边界函数进行鲁棒的裁剪:

def imcrop(img, bbox):
   x1, y1, x2, y2 = bbox
   if x1 < 0 or y1 < 0 or x2 > img.shape[1] or y2 > img.shape[0]:
        img, x1, x2, y1, y2 = pad_img_to_fit_bbox(img, x1, x2, y1, y2)
   return img[y1:y2, x1:x2, :]

def pad_img_to_fit_bbox(img, x1, x2, y1, y2):
    img = cv2.copyMakeBorder(img, - min(0, y1), max(y2 - img.shape[0], 0),
                            -min(0, x1), max(x2 - img.shape[1], 0),cv2.BORDER_REPLICATE)
   y2 += -min(0, y1)
   y1 += -min(0, y1)
   x2 += -min(0, x1)
   x1 += -min(0, x1)
   return img, x1, x2, y1, y2

1
请问bbox在这里是什么意思,我们应该在它的值中提供什么,因为无论我尝试传递什么值,在运行x1, y1, x2, y2 = bbox时都会给出错误提示:TypeError:'int' object is not iterable - Sabah
@sabah 应该是一个包含4个值的元组或列表。如果你将bbox定义为单个整数,就会出现错误。 - Yonatan Simson

7

这里有一些更健壮的 imcrop 代码(有点像 Matlab)

def imcrop(img, bbox): 
    x1,y1,x2,y2 = bbox
    if x1 < 0 or y1 < 0 or x2 > img.shape[1] or y2 > img.shape[0]:
        img, x1, x2, y1, y2 = pad_img_to_fit_bbox(img, x1, x2, y1, y2)
    return img[y1:y2, x1:x2, :]

def pad_img_to_fit_bbox(img, x1, x2, y1, y2):
    img = np.pad(img, ((np.abs(np.minimum(0, y1)), np.maximum(y2 - img.shape[0], 0)),
               (np.abs(np.minimum(0, x1)), np.maximum(x2 - img.shape[1], 0)), (0,0)), mode="constant")
    y1 += np.abs(np.minimum(0, y1))
    y2 += np.abs(np.minimum(0, y1))
    x1 += np.abs(np.minimum(0, x1))
    x2 += np.abs(np.minimum(0, x1))
    return img, x1, x2, y1, y2

这段代码有一个错误,需要先对y2和x2进行+=操作,然后再对y1和x1进行。或者可以计算padY = np.abs(np.minimum(0, y1)),然后只需执行y1 += padY和y2 += padY即可。 - Peter

7
以下是裁剪图像的方法。 image_path:要编辑的图像路径 coords:x/y坐标元组(x1,y1,x2,y2)[在mspaint中打开图像并检查“视图”选项卡中的“标尺”以查看坐标] saved_location:保存裁剪后图像的路径
from PIL import Image
    def crop(image_path, coords, saved_location:
        image_obj = Image.open("Path of the image to be cropped")
            cropped_image = image_obj.crop(coords)
            cropped_image.save(saved_location)
            cropped_image.show()


if __name__ == '__main__':
    image = "image.jpg"
    crop(image, (100, 210, 710,380 ), 'cropped.jpg')

2
为了让您更容易理解,这是我使用的代码:

为了方便起见,以下是我使用的代码:

    top=514
    right=430
    height= 40
    width=100
    croped_image = image[top : (top + height) , right: (right + width)]
    plt.imshow(croped_image, cmap="gray")
    plt.show()

1

使用以下代码来裁剪或选择人脸感兴趣区域(ROI)

import cv2 
face_cascade = cv2.CascadeClassifier('haarcascade_frontalface_default.xml')
image=cv2.imread("ronaldo.jpg")
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
faces = face_cascade.detectMultiScale(gray, 1.3, 5)
for (x,y,w,h) in faces:
     cv2.rectangle(img,(x,y),(x+w,y+h),(255,255,0),2) 
     roi_image = gray[y:y+h, x:x+w]
cv2.imshow("crop/region of interset image",roi_image) 
cv2.waitKey(0)
cv2.destroyAllWindows()

查看参考资料


0
# Import packages
import cv2

import numpy as np
img = cv2.imread('skewness.png')
print(img.shape) # Print image shape

cv2.imshow("original", img)

# Cropping an image
cropped_image = img[80:280, 150:330]
 
# Display cropped image
cv2.imshow("cropped", cropped_image)

# Save the cropped image
cv2.imwrite("Cropped Image.jpg", cropped_image)

#The function waitKey waits for a key event infinitely (when \f$\texttt{delay}\leq 0\f$ ) or for delay milliseconds, when it is positive
cv2.waitKey(0)

#The function destroyAllWindows destroys all of the opened HighGUI windows.
cv2.destroyAllWindows()

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接