我需要获取 Pandas 数据帧列中列表的每个元素出现的频率。
数据示例:
数据示例:
din=pd.DataFrame({'x':[['a','b','c'],['a','e','d', 'c']]})`
x
0 [a, b, c]
1 [a, e, d, c]
f x
0 2 a
1 1 b
2 2 c
3 1 d
4 1 e
我可以将列表扩展为行,然后执行分组操作,但这些数据可能会很大(上百万条记录),想知道是否有更有效/直接的方法。
谢谢