最接近的答案在下方链接中:如何在 pandas 中删除从 excel 读取的重复列
我的要求略有不同。 我有100多个列,列名中可能含有'.'(点)。示例数据帧如下:
我想要删除A、A.1,保留A.2。请给出建议。
df = pd.DataFrame(columns=['A', 'B', 'C','A','D. s'])
因此我无法根据“.1”或“.2”截断。
另外,当我从Excel中读取时,列名被读取为A、A.1和A.2等,因此即使使用以下命令也无法工作。
df = df.loc[:,~df.columns.duplicated()]
我想要删除A、A.1,保留A.2。请给出建议。
df.loc[:,~df.columns.str.replace('\.\d+','').duplicated(keep='last')]
吗? - ankydf.filter(regex=r'^(?!\w\.[0-9])')
吗? - Mayank Porwal