I currently have a dataframe (df) like this:
name info
alpha foo,bar
alpha bar,foo
beta foo,bar
beta bar,foo
beta baz,qux
我希望创建一个像这样的数据框:
name info
alpha (foo,bar),(bar,foo)
beta (foo,bar),(bar,foo),(baz,qux)
我正在使用groupby.apply(list)。
new_df=df.groupby('name')['info'].apply(list)
然而,我不知道如何将输出格式化为原始数据框的格式(即像示例中那样有两列)。
我认为我需要使用reset_index
和unstack
? 感谢任何帮助!
pd.DataFrame(df.groupby('name')['info'].apply(list))
?我感觉还有更简单的方法。 - Patrick Haugh