255得票8回答
在Python Pandas中跨多列删除所有重复行

pandas的drop_duplicates函数非常适合用于使数据帧“独特化”。我想删除所有在一部分列上重复的行。这可能吗? A B C 0 foo 0 A 1 foo 1 A 2 foo 1 B 3 bar 1 A 作为一个例子,我想删除在列 A...

53得票4回答
Pandas的drop_duplicates方法在包含列表的数据框上无法正常工作。

我想在数据框上使用drop_duplicates方法,但是却出现了错误。如下所示: 错误:TypeError: unhashable type: 'list' 我使用的代码:df = db.drop_duplicates() 我的数据库很大,包含字符串、浮点数、日期、NaN、布尔值...

12得票2回答
保留Pandas中最后N个重复项

给定一个数据框:>>> import pandas as pd >>> lol = [['a', 1, 1], ['b', 1, 2], ['c', 1, 4], ['c', 2, 9], ['b', 2, 10], ['x', 2, 5], ['d', 2...

9得票4回答
Pandas - 删除重复项后保留第一个值

我熟悉如何删除重复行,并使用参数first、last、none。这并不太复杂,有大量的示例(例如这里)。 但是,我想找的是一种方法,可以找到重复项,但不是删除所有重复项并保留第一个,而是如果我有重复项,则保留所有重复项,但删除第一个: 因此,我想要的不是“删除重复项,保留第一个”,而是“保...

7得票2回答
如何在 pandas 中删除具有不同列名称的重复数据?

我有一个DataFrame,其中有重复数据但名称不同的列: In[1]: df Out[1]: X1 X2 Y1 Y2 0.0 0.0 6.0 6.0 3.0 3.0 7.1 7.1 7.6 7.6 1.2 1.2 我知道.drop(columns...

7得票3回答
Pandas去重,保留首尾两个重复值,是否可行?

我有一个数据框,我需要删除所有重复的行,但是我需要保留第一行和最后一行。 例如: 1 0 2 0 3 0 4 0 输出: 1 0 4 0 我尝试了df.column.drop_duplicates(keep=("first...

7得票4回答
在列表列中删除重复的元素

这是我的数据框: pd.DataFrame({'A':[1, 3, 3, 4, 5, 3, 3], 'B':[0, 2, 3, 4, 5, 6, 7], 'C':[[1,4,4,4], [1,4,4,4], [3,4,4,5], [3,...