Pandas数据框自动重命名重复的列名

3

我有一个数据框,有10列和160行。列名基于月份和年份,例如Jun'17,July'17,Mar'18等。然而在Excel中,有些列会重复,比如Jun'17会出现两次。当我将它们导入到pandas数据框中时,重复的列会被重命名为Jun'17和Jun'17.1

这个'.1'是多余的,影响了我的整个计算。


1
这是pandas的限制。所有列名必须是唯一的。如果您希望,可以在构造函数/pd.read_csv函数中选择重命名它们。 - FHTMitchell
谢谢,这真的很有帮助,但你能更具体地指导在构造函数中写什么吗? - Aliasgher Nooruddin
构造函数是创建数据框的关键 - 导入语句。 - Josh Friedlander
@AliasgherNooruddin,您想要什么样的输出?您想保留相同的重复名称吗? - Joe
如果你有10列,为什么它们会重复。我曾遇到过类似的问题,但是我只需重新组织我的数据,将每一行放在一个列下面,例如,列"2018年5月"->行("净收入","息税前利润"等)。 - dejanmarich
显示剩余3条评论
1个回答

2

我认为使用相同名称的更多列不是一个好主意,我不建议这样做,但如果你想这么做,可以按照以下方式进行:

df = df.rename(columns = {"Jun'17.1":"Jun'17"})

要访问这两个不同的列,请按照以下方式进行:

df["Jun'17"].iloc[:,0]
df["Jun'17"].iloc[:,1]

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接