如何使用Python中的OpenCV裁剪图像

Question

如何使用Python中的OpenCV裁剪图像

405

我该如何使用OpenCV裁剪图片，就像之前在PIL中所做的那样。

PIL的工作示例：

im = Image.open('0.png').convert('L')
im = im.crop((1, 1, 98, 33))
im.save('_0.png')

但我应该如何在OpenCV上实现呢？

这是我尝试的方法：

im = cv.imread('0.png', cv.CV_LOAD_IMAGE_GRAYSCALE)
(thresh, im_bw) = cv.threshold(im, 128, 255, cv.THRESH_OTSU)
im = cv.getRectSubPix(im_bw, (98, 33), (1, 1))
cv.imshow('Img', im)
cv.waitKey(0)

但它不起作用。

我认为我错误地使用了getRectSubPix。如果是这种情况，请解释如何正确使用此函数。

- Nolik

12个回答

174

我可以为您翻译。以下是翻译的文本：

我有一个问题，在这里找到了另一个答案：复制感兴趣的区域

如果我们将(0,0)视为图像的左上角，图像名为im，从左到右是x方向，从上到下是y方向。如果我们在该图像中有(x1,y1)作为左上顶点，(x2,y2)作为矩形区域内的右下顶点，则：

roi = im[y1:y2, x1:x2]

这是一个关于NumPy数组索引和切片的综合资源，可以告诉你更多关于裁剪图像等内容。在OpenCV2中，图像将存储为NumPy数组。

：）

- samkhan13

1

嗨，根据你的情况，应该是roi = im[y1:y2+1, x1:x2+1]吧？因为numpy使用排除区域来切片。 - Scott Yang

@samkhan13，当我使用这个公式裁剪时，所有的裁剪都具有形状（0，宽度，通道）。也就是说，我根本没有得到y维度。 - mLstudent33

@mLstudent33 可能是图像 im 没有被正确读取，为空。尝试使用带断点的 IDE 逐步诊断您的代码。您可以使用 Google Colab 创建代码块，并在 Stack Overflow Python 聊天室上分享您的 Jupyter 笔记本以获得帮助。 - samkhan13

@samkhan13，实际上我有一个奇怪的问题，我在Github Opencv Issues上发布了：https://github.com/opencv/opencv/issues/15406 我也会查看聊天记录。谢谢！ - mLstudent33

41

这段代码从x=0，y=0剪切图像到h=100，w=200。

import numpy as np
import cv2

image = cv2.imread('download.jpg')
y=0
x=0
h=100
w=200
crop = image[y:y+h, x:x+w]
cv2.imshow('Image', crop)
cv2.waitKey(0)

- m.hatami

@hatami，所以高度是在y = 0的下方100像素，对吗？这是numpy数组的第101行？宽度在x = 0的右侧200像素，对吗？ - mLstudent33

2

赞赏您使用可以真正理解的变量名称。 - Spectric

24

请注意，图像切片不是创建裁剪图片的副本，而是创建指向roi的指针。如果您要加载很多图像，并使用切片裁剪图像的相关部分，然后将其附加到列表中，则可能会浪费大量内存。

假设您加载了N个图像，每个图像都是>1MP，并且您只需要来自左上角的100x100区域。 切片：

X = []
for i in range(N):
    im = imread('image_i')
    X.append(im[0:100,0:100]) # This will keep all N images in the memory. 
                              # Because they are still used.

或者，您可以通过.copy()复制相关部分，这样垃圾收集器就会删除im。

X = []
for i in range(N):
    im = imread('image_i')
    X.append(im[0:100,0:100].copy()) # This will keep only the crops in the memory. 
                                     # im's will be deleted by gc.

在发现这个问题后，我意识到用户1270710曾经提到过其中一个评论，但是我花了很长时间才找到（即调试等）。所以，我认为值得一提。

- smttsp

请看这个链接：https://dev59.com/w-k5XIcBkEYKwwoY3tcY - Abdul Rehman

就占用的内存空间而言，我知道复制感兴趣的区域是最好的选择，但时间消耗呢？如果我使用copy()来复制ROI，与切片相比，结果会如何？此外，如果我有一个变量tmp，我将从计算机加载的每张图片都存储在其中，那么切片对我的内存不应该有不良影响，对吗？您描述的问题仅与在加载所有图像并再次存储它们的ROI时发生的情况有关，同时具有原始图像和ROI。 请让我知道我是否理解正确。 - Cătălina Sîrbu

复制将在我所说的情况下忽略不计。除非您多次复制大型图像，否则不会有时间差异。在我的代码中，每次裁剪的效果将小于1毫秒。问题是，您要么存储大图像和指针（ROI仅为几个字节），要么在内存中存储小图像（在我的情况下）。如果您这样做几次，那就没问题了。但是，如果您这样做数千次，使用切片的内存使用量将变得非常高。如果您使用切片，则在加载几千张图像后填充整个内存。而我的代码仍将按MB的顺序运行。 - smttsp

8

使用opencv的复制边界函数进行鲁棒的裁剪：

def imcrop(img, bbox):
   x1, y1, x2, y2 = bbox
   if x1 < 0 or y1 < 0 or x2 > img.shape[1] or y2 > img.shape[0]:
        img, x1, x2, y1, y2 = pad_img_to_fit_bbox(img, x1, x2, y1, y2)
   return img[y1:y2, x1:x2, :]

def pad_img_to_fit_bbox(img, x1, x2, y1, y2):
    img = cv2.copyMakeBorder(img, - min(0, y1), max(y2 - img.shape[0], 0),
                            -min(0, x1), max(x2 - img.shape[1], 0),cv2.BORDER_REPLICATE)
   y2 += -min(0, y1)
   y1 += -min(0, y1)
   x2 += -min(0, x1)
   x1 += -min(0, x1)
   return img, x1, x2, y1, y2

- belgraviton

1

请问bbox在这里是什么意思，我们应该在它的值中提供什么，因为无论我尝试传递什么值，在运行x1, y1, x2, y2 = bbox时都会给出错误提示：TypeError：'int' object is not iterable - Sabah

@sabah 应该是一个包含4个值的元组或列表。如果你将bbox定义为单个整数，就会出现错误。 - Yonatan Simson

7

这里有一些更健壮的 imcrop 代码（有点像 Matlab）

def imcrop(img, bbox): 
    x1,y1,x2,y2 = bbox
    if x1 < 0 or y1 < 0 or x2 > img.shape[1] or y2 > img.shape[0]:
        img, x1, x2, y1, y2 = pad_img_to_fit_bbox(img, x1, x2, y1, y2)
    return img[y1:y2, x1:x2, :]

def pad_img_to_fit_bbox(img, x1, x2, y1, y2):
    img = np.pad(img, ((np.abs(np.minimum(0, y1)), np.maximum(y2 - img.shape[0], 0)),
               (np.abs(np.minimum(0, x1)), np.maximum(x2 - img.shape[1], 0)), (0,0)), mode="constant")
    y1 += np.abs(np.minimum(0, y1))
    y2 += np.abs(np.minimum(0, y1))
    x1 += np.abs(np.minimum(0, x1))
    x2 += np.abs(np.minimum(0, x1))
    return img, x1, x2, y1, y2

- Dan Erez

这段代码有一个错误，需要先对y2和x2进行+=操作，然后再对y1和x1进行。或者可以计算padY = np.abs(np.minimum(0, y1))，然后只需执行y1 += padY和y2 += padY即可。 - Peter

7

以下是裁剪图像的方法。 image_path：要编辑的图像路径 coords：x/y坐标元组（x1，y1，x2，y2）[在mspaint中打开图像并检查“视图”选项卡中的“标尺”以查看坐标] saved_location：保存裁剪后图像的路径

from PIL import Image
    def crop(image_path, coords, saved_location:
        image_obj = Image.open("Path of the image to be cropped")
            cropped_image = image_obj.crop(coords)
            cropped_image.save(saved_location)
            cropped_image.show()


if __name__ == '__main__':
    image = "image.jpg"
    crop(image, (100, 210, 710,380 ), 'cropped.jpg')

- Sanyal

2

为了让您更容易理解，这是我使用的代码：

为了方便起见，以下是我使用的代码：

    top=514
    right=430
    height= 40
    width=100
    croped_image = image[top : (top + height) , right: (right + width)]
    plt.imshow(croped_image, cmap="gray")
    plt.show()

- El Houcine Es-sanhaji

1

使用以下代码来裁剪或选择人脸感兴趣区域（ROI）

import cv2 
face_cascade = cv2.CascadeClassifier('haarcascade_frontalface_default.xml')
image=cv2.imread("ronaldo.jpg")
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
faces = face_cascade.detectMultiScale(gray, 1.3, 5)
for (x,y,w,h) in faces:
     cv2.rectangle(img,(x,y),(x+w,y+h),(255,255,0),2) 
     roi_image = gray[y:y+h, x:x+w]
cv2.imshow("crop/region of interset image",roi_image) 
cv2.waitKey(0)
cv2.destroyAllWindows()

查看参考资料

- Bharat Natrayn

0

# Import packages
import cv2

import numpy as np
img = cv2.imread('skewness.png')
print(img.shape) # Print image shape

cv2.imshow("original", img)

# Cropping an image
cropped_image = img[80:280, 150:330]
 
# Display cropped image
cv2.imshow("cropped", cropped_image)

# Save the cropped image
cv2.imwrite("Cropped Image.jpg", cropped_image)

#The function waitKey waits for a key event infinitely (when \f$\texttt{delay}\leq 0\f$ ) or for delay milliseconds, when it is positive
cv2.waitKey(0)

#The function destroyAllWindows destroys all of the opened HighGUI windows.
cv2.destroyAllWindows()

- Adesoji Alu

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Froyo · Accepted Answer

823

非常简单，使用numpy切片。

import cv2
img = cv2.imread("lenna.png")
crop_img = img[y:y+h, x:x+w]
cv2.imshow("cropped", crop_img)
cv2.waitKey(0)

- Froyo

10

怎样将裁剪后的图像保存到变量中？ - Nolik

127

请记住，x和y是颠倒的。我忽略了这一点。 - markroxor

25

如果您已经定义了裁剪边距，则可以执行 crop_img = img[margin:-margin, margin:-margin] 进行裁剪。 - Rufus

74

太好了，只是要注意更改crop_img将会改变img。否则，你应该使用crop_img = img[y:y+h, x:x+w].copy()来裁剪图像。 - user1270710

2

使用x，y来解释这有点混乱，实际上最好使用“axis”来解释。在上面的答案中，y实际上代表第一轴，x代表第二轴，参考基础知识。然后我们可以理解为访问第一轴，然后是第二轴。这与Python、Java或C/C++中的2D数组访问相同。 - Ynjxsjmh

显示剩余7条评论