NumPy如何使用数组对数组进行索引切片?

6
也许这个问题已经在其他地方被提出并解决了,但我没有找到。假设我们有一个numpy数组:
a = np.arange(100).reshape(10,10)
b = np.zeros(a.shape)
start = np.array([1,4,7])   # can be arbitrary but valid values
end = np.array([3,6,9])     # can be arbitrary but valid values

startend都有有效的值,使得每个切片对于a也是有效的。我想将a中子数组的值复制到b中相应的位置:

b[:, start:end] = a[:, start:end]   #error

这个语法无效,但它等价于:

b[:, start[0]:end[0]] = a[:, start[0]:end[0]]
b[:, start[1]:end[1]] = a[:, start[1]:end[1]]
b[:, start[2]:end[2]] = a[:, start[2]:end[2]]

我在想是否有更好的方法来处理这个问题,而不是明确地使用 start end 数组进行for循环。谢谢!

起始和结束对之间的差值(这里是2)是否总是恒定的? - Divakar
不一定,这只是一个例子,但可以假设索引是有效的索引。 - galactica
这个回答解决了你的问题吗?如何使用起始和结束索引来切片numpy行 - Ta946
1个回答

6
我们可以使用broadcasting,通过两组与startend数组的比较创建一个需要编辑的地方的掩码,然后使用boolean-indexing进行分配,以实现矢量化解决方案。
# Range array for the length of columns
r = np.arange(b.shape[1])

# Broadcasting magic to give us the mask of places
mask = (start[:,None] <= r) & (end[:,None] >= r)

# Boolean-index to select and assign 
b[:len(mask)][mask] = a[:len(mask)][mask]

示例运行 -

In [222]: a = np.arange(50).reshape(5,10)
     ...: b = np.zeros(a.shape,dtype=int)
     ...: start = np.array([1,4,7])
     ...: end = np.array([5,6,9]) # different from sample for variety
     ...: 

# Mask of places to be edited
In [223]: mask = (start[:,None] <= r) & (end[:,None] >= r)

In [225]: print mask
[[False  True  True  True  True  True False False False False]
 [False False False False  True  True  True False False False]
 [False False False False False False False  True  True  True]]

In [226]: b[:len(mask)][mask] = a[:len(mask)][mask]

In [227]: a
Out[227]: 
array([[ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9],
       [10, 11, 12, 13, 14, 15, 16, 17, 18, 19],
       [20, 21, 22, 23, 24, 25, 26, 27, 28, 29],
       [30, 31, 32, 33, 34, 35, 36, 37, 38, 39],
       [40, 41, 42, 43, 44, 45, 46, 47, 48, 49]])

In [228]: b
Out[228]: 
array([[ 0,  1,  2,  3,  4,  5,  0,  0,  0,  0],
       [ 0,  0,  0,  0, 14, 15, 16,  0,  0,  0],
       [ 0,  0,  0,  0,  0,  0,  0, 27, 28, 29],
       [ 0,  0,  0,  0,  0,  0,  0,  0,  0,  0],
       [ 0,  0,  0,  0,  0,  0,  0,  0,  0,  0]])

谢谢!这个掩码技巧看起来很不错!但是它会导致任何效率问题吗?例如,在此示例中复制整个ndarray?在实际情况中,我有一个相当大的ndarray,例如a.shape=(128, 32x32x32),这样的值分配将根据每次迭代的不同起始/结束值重复多次。 - galactica
@galactica 我们是在指哪一个拷贝呢?你是在指哪一步呢? - Divakar
如果你在谈论这个代码:a[:len(mask)][mask],那么这是无法通过掩码避免的,也无法以向量化的方式切片整个数组。所以,如果内存效率是一个问题,我想保留循环并使用类似于:b[0, start[0]:end[0]] = a[0, start[0]:end[0]]等方法。 - Divakar
太好了!感谢详细的解释!让我们稍等一下,看看是否有其他答案。 - galactica
@CaptainTrojan 正如代码中所列 r = np.arange(b.shape[1]) - Divakar
显示剩余2条评论

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接