有一个叫做"subset"的数据框,代码如下。pd是pandas的昵称。我无法理解by = lambda x: lambda y: getattr(y, x)
的含义。
pivot = pd.pivot_table(subset, values='count', rows=['date'], cols=['sample'], fill_value=0)
by = lambda x: lambda y: getattr(y, x)
grouped = pivot.groupby([by('year'),by('month')]).sum()
year
和month
是列,我猜它正在执行与grouped = pivot.groupby(['year', 'month']).sum()
相同的操作。 - Stefano Potteryear
和month
不是列名。它们在代码中首次出现,可以成功运行。子集中有一个名为“date”的列,我正在尝试找到它们之间的关系。@StefanoPotter - zhql0907