我希望能够定义一个函数,用于计算任意两个pandas列之间的百分比差异。 假设我的dataframe已经定义如下:
R1 R2 R3 R4 R5 R6
A B 1 2 3 4
我希望我的计算被定义为
df['R7'] = df[['R3','R4']].apply( method call to calculate perc diff)
和
df['R8'] = df[['R5','R6']].apply(same method call to calculate perc diff)
我该怎么做?
我已经尝试过以下方法:
df['perc_cnco_error'] = df[['CumNetChargeOffs_x','CumNetChargeOffs_y']].apply(lambda x,y: percCalc(x,y))
def percCalc(x,y):
if x<1e-9:
return 0
else:
return (y - x)*100/x
并且它给了我错误信息
类型错误:('()接受恰好2个参数(已给1个)',u'出现在索引CumNetChargeOffs_x处')
axis
关键字参数为1,否则apply
将执行逐行操作。因此,请尝试执行lambda x: percCalc(x['R3'], x['R4'])
并查看其是否有效! - spicypumpkin