得票数最多 'drop-duplicates' 问题

关联标签

255得票8回答

pandas的drop_duplicates函数非常适合用于使数据帧“独特化”。我想删除所有在一部分列上重复的行。这可能吗？ A B C 0 foo 0 A 1 foo 1 A 2 foo 1 B 3 bar 1 A 作为一个例子，我想删除在列 A...

53得票4回答

我想在数据框上使用drop_duplicates方法，但是却出现了错误。如下所示：错误：TypeError: unhashable type: 'list' 我使用的代码：df = db.drop_duplicates() 我的数据库很大，包含字符串、浮点数、日期、NaN、布尔值...

12得票2回答

给定一个数据框：>>> import pandas as pd >>> lol = [['a', 1, 1], ['b', 1, 2], ['c', 1, 4], ['c', 2, 9], ['b', 2, 10], ['x', 2, 5], ['d', 2...

9得票4回答

我熟悉如何删除重复行，并使用参数first、last、none。这并不太复杂，有大量的示例（例如这里）。但是，我想找的是一种方法，可以找到重复项，但不是删除所有重复项并保留第一个，而是如果我有重复项，则保留所有重复项，但删除第一个：因此，我想要的不是“删除重复项，保留第一个”，而是“保...

7得票2回答

我有一个DataFrame，其中有重复数据但名称不同的列： In[1]: df Out[1]: X1 X2 Y1 Y2 0.0 0.0 6.0 6.0 3.0 3.0 7.1 7.1 7.6 7.6 1.2 1.2 我知道.drop(columns...

7得票3回答

我有一个数据框，我需要删除所有重复的行，但是我需要保留第一行和最后一行。例如: 1 0 2 0 3 0 4 0 输出： 1 0 4 0 我尝试了df.column.drop_duplicates(keep=("first...

7得票4回答

这是我的数据框： pd.DataFrame({'A':[1, 3, 3, 4, 5, 3, 3], 'B':[0, 2, 3, 4, 5, 6, 7], 'C':[[1,4,4,4], [1,4,4,4], [3,4,4,5], [3,...