规范化双变量概率密度函数 - Python

4

我想要标准化下面表示的概率密度函数Norm1。当我直接将该方程式导入到ax.contour时,它可以正常工作,但在调用该方程式外部时却不行。

当我尝试将Norm1传递给ax.contour时,我收到以下错误:

    raise TypeError(f"Input z must be 2D, not {z.ndim}D")

TypeError: Input z must be 2D, not 3D

为了提供背景,我有两个不同的组,其中包含各种XY点。每个XY点都有一个标识符,标记为id。我为每个唯一点分配一个圆或半径。我想要从每个组中减去PDF。输出是一个从0到1归一化的PDF,其中>0.5由组A控制,<0.5由组B控制。

df = pd.DataFrame({'Int_1': [1.0, 2.0, 1.0, 3.0, 1.0, 2.0, 3.0, 2.0], 

           'Int_2': [1.0, 2.0, 2.0, 2.0, 1.0, 1.0, 1.0, 2.0],
           'Item_X': [0.0, 0.0, 0.0, 0.0, 1.0, 1.0, 1.0, 1.0],
           'Item_Y': [0.0, 0.0, 0.0, 0.0, 1.0, 1.0, 1.0, 1.0],               
           'Period': [1, 1, 1, 1, 2, 2, 2, 2],
           'Group': ['A', 'B', 'A', 'B', 'A', 'B', 'A', 'B'],
           'Item': ['Y', 'Y', 'A', 'B', 'A', 'B', 'A', 'B'],
           'id': ['1', '2', '3', '4', '1', '2', '3', '4']})

Group_A = [df[df['Group'] == 'A'][['Int_1','Int_2']].to_numpy()]
Group_B = [df[df['Group'] == 'B'][['Int_1','Int_2']].to_numpy()]
Item = [df[['Item_X','Item_Y']].to_numpy()]

period = df['Period'].drop_duplicates().reset_index(drop = True)


def impact_func(member_no, location, time_index, group):

  if group == 'A':
    data = Group_A.copy()

  elif group == 'B':
    data = Group_B.copy()

  else:

    return

  if np.all(np.isfinite(data[member_no][[time_index,time_index + 1],:])) & np.all(np.isfinite(Item[0][time_index,:])):

    sxy = (data[member_no][time_index + 1,:] - data[member_no][time_index,:]) / (period[time_index + 1] - period[time_index])

    mu = data[member_no][time_index,:] + sxy * 0.5

    out = mvn.pdf(location,mu) / mvn.pdf(data[member_no][time_index,:],mu)

  else:
    out = np.zeros(location.shape[0])

  return out

xx,yy = np.meshgrid(np.linspace(-10,10,200),np.linspace(-10,10,200))
Z_GA = np.zeros(40000)
Z_GB = np.zeros(40000)

for k in range(1):
  Z_GA += impact_func(k,np.c_[xx.flatten(),yy.flatten()],0,'A')
  Z_GB += impact_func(k,np.c_[xx.flatten(),yy.flatten()],0,'B')

fig, ax = plt.subplots(figsize=(8,8))
ax.set_xlim(-10,10)
ax.set_ylim(-10,10)

Z_GA = Z_GA.reshape((200,200))
Z_GB = Z_GB.reshape((200,200))

Norm1 = xx,yy, 1 / (1 + np.exp(Z_GB - Z_GA))
Norm2 = Z_GA / (Z_GA + Z_GB)

#cfs = ax.contourf(Norm1, cmap = 'magma')
cfs = ax.contourf(xx,yy, 1 / (1 + np.exp(Z_GB - Z_GA)), cmap = 'magma')

fig.colorbar(cfs, ax = ax)

1
嗨@chopin,我尝试运行代码,但缺少Z(第78行)和normPDF()(第82行)。你能修复一下吗? - Paulo Schau Guerra
1
我的错误,现在一切正常。 - Chopin
也许您可以提供更多信息?您所说的“空间影响”是什么意思?很难确定您试图建模的内容。 - Him
@Him,现在怎么样了? - Chopin
1个回答

3

解决方案

您只需解压缩Norm1

cfs = ax.contourf(*Norm1, cmap = 'magma')

结果:

使用解包的contourf

简要说明:

Norm1是一个由3个数组组成的元组。contourf需要一个到三个值[X,Y,Z],其中Z保存每个点的高度。

如果直接传递Norm1contourf会认为它仅是Z参数,并将其在内部解释为3D ndarray。

使用*解包后,您将明确地将Nomr1的三个组成部分作为三个不同的参数传递,即X、Y和Z


啊,好的。太棒了。谢谢你。这可能需要另一个问题,但是当传递Norm2时,它只在两个轴上绘制0-10的z值。算法是否存在潜在问题? - Chopin
我无法复现这种行为,除非我明确设置 xx,yy = np.meshgrid(np.linspace(0, 10, 200),np.linspace(0, 10, 200)) - Whole Brain
我成功地通过设置一个带有NaN的Norm2来复现它,其中x<0或y<0。在您的向量化操作中,您应该检查零除法或负数的对数,因为numpy会通过将其设置为数组中的NaNs来强制执行“未定义”的结果。 - Whole Brain

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接