如何将一个numpy数组分割成重叠的瓷砖?

5

如何使用Python和numpy库将 a 数组转换为下面指定的 b 数组?我正在寻找一种非常高效的方式,因为我要在实际数组上使用这种方法很大。我应该提到,数字可以是任何数,并且数字之间没有关系。另外,我尝试在下面的图片中展示了我希望如何切片数组。

import numpy as np
a = np.arange(1, 49).reshape(6, 8)


a =   [[ 1,  2,  3,  4,  5,  6,  7,  8],
       [ 9, 10, 11, 12, 13, 14, 15, 16],
       [17, 18, 19, 20, 21, 22, 23, 24],
       [25, 26, 27, 28, 29, 30, 31, 32],
       [33, 34, 35, 36, 37, 38, 39, 40],
       [41, 42, 43, 44, 45, 46, 47, 48]]

b =[[1, 2, 9, 10], [2, 3, 10, 11], [3, 4, 11, 12], [4, 5, 12, 13],
    [5, 6, 13, 14], [6, 7, 14, 15], [7, 8, 15, 16], [9, 10, 17, 18],
    [10, 11, 18, 19], [11, 12, 19, 20], [12, 13, 20, 21], [13, 14, 21, 22],
    [14, 15, 22, 23], [15, 16, 23, 24], [17, 18, 25, 26], [18, 19, 26, 27],
    [19, 20, 27, 28], [20, 21, 28, 29], [21, 22, 29, 30], [22, 23, 30, 31],
    [23, 24, 31, 32], [25, 26, 33, 34], [26, 27, 34, 35], [27, 28, 35, 36],
    [28, 29, 36, 37], [29, 30, 37, 38], [30, 31, 38, 39], [31, 32, 39, 40], 
    [33, 34, 41, 42], [34, 35, 42, 43], [35, 36, 43, 44], [36, 37, 44, 45],
    [37, 38, 45, 46], [38, 39, 46, 47], [39, 40, 47, 48]]

我试图使用reshape和transpose函数来解决问题,但是我无法找到一种方法来包括边界。c显示了我的解决思路。
c = a.reshape(3, 2, 4, 2).transpose(0, 2, 3, 1).reshape(3*4, 2*2).

图片链接:https://ibb.co/QC7tkPM

那个重塑/转置组合可以将数组“打破”成块,但它们不会重叠。有一个名为as_strided的函数可以制作重叠块,用于像移动平均这样的事情。更新版本具有导数windowing函数。 - hpaulj
2个回答

4

使用 numpy 1.20 或更高版本,您可以使用 np.lib.stride_tricks.sliding_window_view

import numpy as np
a = np.arange(12).reshape(3, 4)
print(a)

提供:

[[ 0  1  2  3]
 [ 4  5  6  7]
 [ 8  9 10 11]]

下面是滑动窗口的形状:(2,2)

windows = np.lib.stride_tricks.sliding_window_view(a, (2,2))
print(windows)

它会提供:

[[[[ 0  1]
   [ 4  5]]

  [[ 1  2]
   [ 5  6]]

  [[ 2  3]
   [ 6  7]]]


 [[[ 4  5]
   [ 8  9]]

  [[ 5  6]
   [ 9 10]]

  [[ 6  7]
   [10 11]]]]

在早期版本的 numpy 中,可以使用 np.lib.index_tricks.as_strided 来获得类似的结果:
w = 2  # width and height of the sliding window

r, c = a.shape
size = a.itemsize
ast = np.lib.index_tricks.as_strided
windows_ast = ast(a,
                  shape=(r - w + 1, c - w + 1, w, w),
                  strides=(c * size, size, c * size, size))
print(windows_ast)

它会给出:

[[[[ 0  1]
   [ 4  5]]

  [[ 1  2]
   [ 5  6]]

  [[ 2  3]
   [ 6  7]]]


 [[[ 4  5]
   [ 8  9]]

  [[ 5  6]
   [ 9 10]]

  [[ 6  7]
   [10 11]]]]

注意,NumPy文档警告说,如果可能的话应避免使用np.lib.stride_tricks.as_strided,因为它的结果可能会导致几个问题。如果输入数组没有连续的内存布局,则上述代码也可能失败。
在任何情况下,您都可以将结果重塑为所需形状:
windows.reshape(-1, 4)

它提供了:

array([[ 0,  1,  4,  5],
       [ 1,  2,  5,  6],
       [ 2,  3,  6,  7],
       [ 4,  5,  8,  9],
       [ 5,  6,  9, 10],
       [ 6,  7, 10, 11]])

1
那个windows是一个view,但是重新调整会复制一个副本。对于非常大的数组来说,这可能代价高昂。 - hpaulj
1
reshape()函数也会创建新的视图,而不是分配新的内存空间。 - eroot163pi
Reshape(重塑)在可能的情况下返回一个视图,否则会创建一个副本。从上面的例子中可以看出,返回了一个副本,因此对于大数组来说,这将是一个问题。 - bb1

0
感谢大家提供的解决方案和见解。这让我有了更新numpy到1.21.2的理由。当我们愿意使用np.repeat在边界处重复行和列时,reshape/transpose组合也可以工作。然而,这比np.lib.stride_tricks.sliding_window_view更昂贵。以下是一个示例:
a = np.arange(1,49).reshape(6,8)

aa = np.repeat(a, repeats=[1,2,2,2,2,1], axis=0)

aa = np.repeat(aa, repeats=[1,2,2,2,2,2,2,1], axis=1)

b = aa.reshape(5,2,7,2).transpose(0,2,3,1).reshape(5*7,2*2)

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接