Pandas DataFrame列命名规范

25

是否有常用的Pandas DataFrame列命名约定?这里是否推荐使用PEP8(例如实例变量)?

注意到许多数据是带有头部信息从外部源加载的,但当我必须自行命名/重命名列时,正确的方法是什么呢?

3个回答

25

有些人倾向于使用 蛇形命名法(小写加下划线)以便可以像这样使用点操作符访问列:df.my_column

我倾向于始终使用 df['my_column'] 语法,因为它避免了与 DataFrame 方法和属性的混淆,并且更容易扩展为切片和花式索引,所以蛇形命名法是不必要的。

简而言之,我认为您应该使用对潜在读者最清晰的方式。


7

还有一件需要记住的事情,如果你的应用程序还使用了关系型数据库,建议你将 Pandas 命名约定与关系型数据库表的列名保持一致。


2

pandas 的创始人没有给出明确的指导,选择实际上在先前提到的 snakePascal (camel) case 之间进行,或者是在 df[my_column]df[MyColumn] 之间进行,并且这取决于个人喜好。许多 R 包使用 snake case 来命名数据框。我认为 snake case 更易读,而 Pascal case 则需要更少的字符。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接