Pandas数据框自动重命名重复的列名

Question

3

我有一个数据框，有10列和160行。列名基于月份和年份，例如Jun'17，July'17，Mar'18等。然而在Excel中，有些列会重复，比如Jun'17会出现两次。当我将它们导入到pandas数据框中时，重复的列会被重命名为Jun'17和Jun'17.1

这个'.1'是多余的，影响了我的整个计算。

- Aliasgher Nooruddin

1

这是pandas的限制。所有列名必须是唯一的。如果您希望，可以在构造函数/pd.read_csv函数中选择重命名它们。 - FHTMitchell

谢谢，这真的很有帮助，但你能更具体地指导在构造函数中写什么吗？ - Aliasgher Nooruddin

构造函数是创建数据框的关键 - 导入语句。 - Josh Friedlander

@AliasgherNooruddin，您想要什么样的输出？您想保留相同的重复名称吗？ - Joe

如果你有10列，为什么它们会重复。我曾遇到过类似的问题，但是我只需重新组织我的数据，将每一行放在一个列下面，例如，列"2018年5月"->行("净收入"，"息税前利润"等)。 - dejanmarich

显示剩余3条评论

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Joe · Accepted Answer

我认为使用相同名称的更多列不是一个好主意，我不建议这样做，但如果你想这么做，可以按照以下方式进行：

df = df.rename(columns = {"Jun'17.1":"Jun'17"})

要访问这两个不同的列，请按照以下方式进行：

df["Jun'17"].iloc[:,0]
df["Jun'17"].iloc[:,1]