在Pandas DataFrame中添加新列(Python)

60

我在Pandas中有一个数据框,例如:

Col1 Col2
A     1 
B     2
C     3

如果我想要添加另一列名为Col3,并且该值基于Col2。在公式中,如果Col2 > 1,则Col3为0,否则为1。因此,在上面的示例中,输出将是:

Col1 Col2 Col3
A    1    1
B    2    0
C    3    0

有什么想法可以实现这个吗?


这个问题与提到的问题不是重复的。请仔细查看内容,而不仅仅是主题。 - themefield
2个回答

78

你只需要进行一个相反的比较。 if Col2 <= 1。这将返回一个布尔系列,其中对于大于1的值为False,其他值为True。如果您将其转换为int64数据类型,True将变为1False将变为0

df['Col3'] = (df['Col2'] <= 1).astype(int)

如果您想要一个更一般化的解决方案,在其中可以根据Col2的值分配任何数字给Col3,那么您应该像这样做:

df['Col3'] = df['Col2'].map(lambda x: 42 if x > 1 else 55)
或者:
df['Col3'] = 0
condition = df['Col2'] > 1
df.loc[condition, 'Col3'] = 42
df.loc[~condition, 'Col3'] = 55

太棒了。非常感谢您的建议。我已经尝试过了,它很有效! - Santiago Munez
我可以使用df['col4'] = df['col2', 'col1'].map(lambda x: 20 if x > 1 elif x > 10 x:40 else 100)吗? - Payne
@Payne,不,这样做不行,只适用于精确的一列。 - VMAtm
嗨@VMAtm,我该如何使用多个条件来添加新列?例如,如果我有两列都是数值型的,并且我想使用条件if col1> 2 and col2> 1。那么,对于这种情况,我该如何利用上述“lambda”解决方案?请帮帮我! - Abdul Rehman
@AbdulRehman 如果你有新的问题,请提出来,不要在评论中讨论。 - VMAtm
显示剩余2条评论

0
我发现向DataFrame添加列的最简单方法是使用“add”函数。以下是代码片段,还包括将输出保存到CSV文件中。请注意,包括“columns”参数可以设置列的名称(这恰好与我用作数据源的np.array的名称相同)。
#  now to create a PANDAS data frame
df = pd.DataFrame(data = FF_maxRSSBasal, columns=['FF_maxRSSBasal'])
# from here on, we use the trick of creating a new dataframe and then "add"ing it
df2 = pd.DataFrame(data = FF_maxRSSPrism, columns=['FF_maxRSSPrism'])
df = df.add( df2, fill_value=0 )
df2 = pd.DataFrame(data = FF_maxRSSPyramidal, columns=['FF_maxRSSPyramidal'])
df = df.add( df2, fill_value=0 )
df2 = pd.DataFrame(data = deltaFF_strainE22, columns=['deltaFF_strainE22'])
df = df.add( df2, fill_value=0 )
df2 = pd.DataFrame(data = scaled, columns=['scaled'])
df = df.add( df2, fill_value=0 )
df2 = pd.DataFrame(data = deltaFF_orientation, columns=['deltaFF_orientation'])
df = df.add( df2, fill_value=0 )
#print(df)
df.to_csv('FF_data_frame.csv')

不好使,兄弟。 - user3553260

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接