使用条件语句为Pandas系列创建函数

3

这是一个非常简单的问题,但是我在这里找不到类似的答案。我有一个Pandas数据框,我想对列中的每个元素应用一个函数。因此,我正在构建最简单的结构:

def PolyNO(x):
if x >= 0:
    x=-0.0001086*x**3 + 0.002878*x**2 + 0.9834*x + 0.2068
else:
    x=-0.0008852*x**3 - 0.01401*x**2 + 0.9585*x + 0.08614
return x

for k in range(len(DATValues[i])):
    DATValues[k].ix[:,2]=PolyNO(DATValues[k].ix[:,2])

该程序输出一个答案:
ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all().

使用上述所有命题并不可行。问题出在哪里?
1个回答

3

我认为你可以使用numpy.where函数:

x = DATValues.ix[:,2]
print (x)
0    5
1    6
2    2
3    7
4    4
5    7
6    8
7    9
Name: c, dtype: int64

DATValues['new'] = (np.where(x >= 0, 
                   -0.0001086*x**3 + 0.002878*x**2 + 0.9834*x + 0.2068,
                   -0.0008852*x**3 - 0.01401*x**2 + 0.9585*x + 0.08614))

print (DATValues)            
        a  b  c       new
0  201603  A  5  5.182175
1  201503  A  6  6.187350
2  201403  A  2  2.184243
3  201303  A  7  7.194372
4  201603  B  4  4.179498
5  201503  B  7  7.194372
6  201403  B  8  8.202589
7  201303  B  9  9.211349   

如果你需要覆盖第三列:

3.

x = DATValues.ix[:,2]

DATValues.ix[:,2] = (np.where(x >= 0, 
                   -0.0001086*x**3 + 0.002878*x**2 + 0.9834*x + 0.2068,
                   -0.0008852*x**3 - 0.01401*x**2 + 0.9585*x + 0.08614))

print (DATValues)            
        a  b         c
0  201603  A  5.182175
1  201503  A  6.187350
2  201403  A  2.184243
3  201303  A  7.194372
4  201603  B  4.179498
5  201503  B  7.194372
6  201403  B  8.202589
7  201303  B  9.211349 

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接