np.apply_over_axes
与R的apply
在几个方面不同。
首先,np.apply_over_axes
需要指定要折叠的轴,而R的apply
需要指定剩余的轴。
其次,np.apply_over_axes
按迭代方式应用函数,如下所述文档。对于np.sum
,结果是相同的,但对于其他函数可能不同。
func被调用为res = func(a,axis),其中axis是axes的第一个元素。函数调用的结果res必须与a具有相同的维度或比a少一维。如果res比a少一维,则在axis之前插入一个维度。然后在axes中的每个轴上重复使用func,以res作为第一个参数。
对于np.apply_over_axes
,func需要采用特定格式,并且func的返回值需要采用特定形状才能正确执行np.apply_over_axes
。
这是一个关于编程的例子,展示了
np.apply_over_axes
失败的情况。
>>> arr.shape
(5, 4, 3, 2)
>>> np.apply_over_axes(np.mean, arr, (0,1))
array([[[[ 0.05856732, -0.14844212],
[ 0.34214183, 0.24319846],
[-0.04807454, 0.04752829]]]])
>>> np_mean = lambda x: np.mean(x)
>>> np.apply_over_axes(np_mean, arr, (0,1))
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "<__array_function__ internals>", line 5, in apply_over_axes
File "/Users/kwhkim/opt/miniconda3/envs/rtopython2-pip/lib/python3.8/site-packages/numpy/lib/shape_base.py", line 495, in apply_over_axes
res = func(*args)
TypeError: <lambda>() takes 1 positional argument but 2 were given
由于Python中似乎没有与之等价的函数,我编写了一个类似于R语言中的apply
函数的函数。
def np_apply(arr, axes_remain, fun, *args, **kwargs):
axes_remain = tuple(set(axes_remain))
arr_shape = arr.shape
axes_to_move = set(range(len(arr.shape)))
for axis in axes_remain:
axes_to_move.remove(axis)
axes_to_move = tuple(axes_to_move)
arr, axes_to_move
arr2 = np.moveaxis(arr, axes_to_move, [-x for x in list(range(1,len(axes_to_move)+1))]).copy()
arr2 = arr2.reshape([arr_shape[x] for x in axes_remain]+[-1])
return np.apply_along_axis(fun, -1, arr2, *args, **kwargs)
至少对于上面的示例样本来说,它运行正常(结果可能与上面的结果不完全相同,但math.close()
几乎对所有元素返回True)。
>>> np_apply(arr, (2,3), np.mean)
array([[ 0.05856732, -0.14844212],
[ 0.34214183, 0.24319846],
[-0.04807454, 0.04752829]])
>>> np_apply(arr, (2,3), np_mean)
array([[ 0.05856732, -0.14844212],
[ 0.34214183, 0.24319846],
[-0.04807454, 0.04752829]])
为了使该函数在大型多维数组中平稳运行,需要进行优化。例如,应防止数组复制。
总之,它似乎可以作为概念验证而发挥作用,希望能有所帮助。
PS)
arr
由
arr = np.random.normal(0,1,(5,4,3,2))
生成。