我在Python中有三个数组
a = np.array([[10., 10., 10., 10.], [10., nan, 10., 10.], [10., 10., nan, 10.]])
b = np.array([[10., 10., 10., 10.], [10., 10., 10., nan], [10., 10.,nan, 10]])
c = np.array([[10., nan, 10., 10.], [nan, 10., 10., nan], [10., 10.,nan, 10]])
我需要计算平均值才能得到以下数组:
>>> myavg
array([[ 10., 10, 10., 10.],
[ 10, 10., 10., 10.],
[ 10., 10., nan, 10.]])
第一步是将数组转换为新的[0,1]数组并求和(即3 = 每个数组中的数据,2 = 仅在两个数组中的数据,1 = 仅在一个数组中的数据,0 = 没有数据)
aa = a.copy()
bb = b.copy()
cc = c.copy()
aa[aa == 10.] = 1
aa[aa != 1] = 0
bb[bb == 10.] = 1
bb[bb != 1] = 0
cc[cc == 10.] = 1
cc[cc != 1] = 0
dd = aa + bb + cc
>>> dd
array([[ 3., 2., 3., 3.],
[ 2., 2., 3., 1.],
[ 3., 3., 0., 3.]])
第二个步骤是将原始数组中的所有数字相加,然后除以dd。
c = a+b+c
>>> c
array([[ 30., nan, 30., 30.],
[ nan, nan, 30., nan],
[ 30., 30., nan, 30.]])
问题非常明显。当我将一个值与NaN相加时,会得到NaN。我不能将NaN转换为“0”,因为在我的实际情况中,“0”是一个值(例如温度)。