卷积算法的天真实现

3

目前正在通过斯坦福CS131免费在线课程学习计算机视觉和机器学习。遇到了一些复杂的数学公式,想知道如何仅仅知道图像高度、宽度和卷积核高度、宽度的情况下实现一个简单的四重循环的卷积算法。我在网上研究后得出了这个解决方案。

image_padded = np.zeros((image.shape[0] + 2, image.shape[1] + 2))
image_padded[1:-1, 1:-1] = image
for x in range(image.shape[1]):  # Loop over every pixel of the image
    for y in range(image.shape[0]):
        # element-wise multiplication of the kernel and the image
        out[y, x] = (kernel * image_padded[y:y + 3, x:x + 3]).sum()

我能够理解这个算法,因为一些网站使用了这种类型的算法的例子,然而我似乎不能理解如何用4个嵌套的循环来完成它。如果可以的话,请将公式分解为更容易理解的东西,而不是在网上找到的给定数学方程式。
编辑: 只是为了澄清,虽然我留下的代码片段在某种程度上是有效的,但我正在尝试想出一种解决方案,它更少优化,对初学者更友好,就像这段代码所要求的那样:
def conv_nested(image, kernel):
    """A naive implementation of convolution filter.

    This is a naive implementation of convolution using 4 nested for-loops.
    This function computes convolution of an image with a kernel and outputs
    the result that has the same shape as the input image.

    Args:
        image: numpy array of shape (Hi, Wi)
        kernel: numpy array of shape (Hk, Wk)

    Returns:
        out: numpy array of shape (Hi, Wi)
    """
    Hi, Wi = image.shape
    Hk, Wk = kernel.shape
    out = np.zeros((Hi, Wi))
    ### YOUR CODE HERE

    ### END YOUR CODE

    return out

3
首先,尝试手动完成它。 - hkchengrex
1个回答

17

对于这个任务,scipy.signal.correlate2d是您的好朋友。

演示

我将您的代码封装在名为naive_correlation的函数中:

import numpy as np

def naive_correlation(image, kernel):
    image_padded = np.zeros((image.shape[0] + 2, image.shape[1] + 2))
    image_padded[1:-1, 1:-1] = image
    out = np.zeros_like(image)
    for x in range(image.shape[1]):image
        for y in range(image.shape[0]):
            out[y, x] = (kernel * image_padded[y:y + 3, x:x + 3]).sum()
    return out

请注意,您的代码段会因为out未初始化而抛出错误。

In [67]: from scipy.signal import correlate2d

In [68]: img = np.array([[3, 9, 5, 9],
    ...:                 [1, 7, 4, 3],
    ...:                 [2, 1, 6, 5]])
    ...: 

In [69]: kernel = np.array([[0, 1, 0],
    ...:                    [0, 0, 0],
    ...:                    [0, -1, 0]])
    ...: 

In [70]: res1 = correlate2d(img, kernel, mode='same')

In [71]: res1
Out[71]: 
array([[-1, -7, -4, -3],
       [ 1,  8, -1,  4],
       [ 1,  7,  4,  3]])

In [72]: res2 = naive_correlation(img, kernel)

In [73]: np.array_equal(res1, res2)
Out[73]: True

如果您想执行卷积而不是相关操作,您可以使用convolve2d

编辑

这是您要找的内容吗?

def explicit_correlation(image, kernel):
    hi, wi= image.shape
    hk, wk = kernel.shape
    image_padded = np.zeros(shape=(hi + hk - 1, wi + wk - 1))    
    image_padded[hk//2:-hk//2, wk//2:-wk//2] = image
    out = np.zeros(shape=image.shape)
    for row in range(hi):
        for col in range(wi):
            for i in range(hk):
                for j in range(wk):
                    out[row, col] += image_padded[row + i, col + j]*kernel[i, j]
    return out

感谢您对这些库的见解,虽然不完全符合我的要求,但它确实为我提供了新的选择。不幸的是,我无法点赞。 - Jay
修改了我的答案以更好地满足您的需求。 - Tonechas
谢谢,伙计。真希望我能点赞,但我的账户还没有达到那个级别。 - Jay

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接