我有一个问题,我感觉可能已经有人问过了,但是问法不同。如果是这种情况,请指向原始问题。
无论如何,我正在使用Pandas的extractall()
方法,但我不太喜欢它返回带有多级索引(原始索引->'匹配'索引)
的DataFrame,所有找到的元素都列在match 0、match 1、match 2等下面
。
我更喜欢输出是一个单索引的DataFrame,在单个单元格中返回多个正则表达式搜索结果(如果适用)作为列表。目前是否可能实现这一点?
以下是我心目中的可视化效果:
当前输出:
X
index match
0 0 thank
1 0 thank
1 thanks
2 thanking
2 0 thanked
期望的输出
X
index
0 thank
1 [thank, thanks, thanking]
2 thanked
我会非常感激任何建议。