我在寻找一种类似于SQL中的操作方法。
SELECT DISTINCT col1, col2 FROM dataframe_table
pandas的sql比较中并没有关于distinct
的内容。
.unique()
只适用于单列,所以我想我可以将列连接起来,或者将它们放在一个列表/元组中进行比较,但这似乎不是pandas更本地的方式。
我是否漏掉了一些明显的东西,或者根本没有办法做到这一点?
df.apply(pd.Series.unique)
这样的操作,但是如果每列的唯一值数量不同,这种方法就行不通了,所以你需要构建一个字典,将列名作为键,唯一值作为值。 - EdChum