如何在使用pandas数据框的apply函数时中断程序？

Question

3

有没有一种方法可以使用apply函数为pandasdataframe计算新列，但根据某些条件“中断”它。

假设我有一个2000行的数据框，并且我的条件取决于先前计算的应用值，在第1000个行时变为false。计算接下来的1000是一种浪费，我希望pandas在第1000个后停止“应用”并将到目前为止计算出的内容返回给我。

是否可能？将返回“最初的回答”。

- Chapo

你好。不知道你是否找到了解决这个问题的方法？ - Confounded

无法记住，抱歉。 - Chapo

2个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- nassim · Answer 1

使用带有条件的apply函数

df['new']=df['old'].apply(lambda x: <calculation> if <condition>(ex : x == 0) else x )

或者

df.loc[df['col']=='value','col']= df.loc[df['col']=='value','col'].apply(lambda x: "new_value"  )

- hunzter · Answer 2

您可以仅对您想要的行应用操作。

假设您的索引是自动递增且连续的，如果不是，您可以随时执行reset_index来实现。或者您可以选择任何您想要的条件，而不是前1000行。

idx = df.index < 1000 # index of 1000 items

df.loc[idx, '<yourcolums>'] = df[idx].apply(...)