根据另一个列表中的值，从元组列表中删除重复值

Question

根据另一个列表中的值，从元组列表中删除重复值

7

我有两个类似这样的列表：

l1 = [('zero', 0),('one', 2),('two', 3),('three', 3),('four', 5)]
l2 = [('zero', 0),('one', 3),('four', 2),('ten', 3),('twelve', 8)]

我想比较这两个列表并

如果两个值相同，从两个列表中都移除重复项
如果第一个值匹配，则从列表中删除第二个值较低的元组

我可以用以下方法实现第一个要求：

l3 = [(a,b) for (a,b) in l1 if (a,b) not in l2]
l4 = [(a,b) for (a,b) in l2 if (a,b) not in l1]

或者使用 set，虽然它不能保证顺序。

l3 = set(l1) - set(l2)

但我很难理解第二个。我试图只根据第一个值进行删除。

l3 = [(a,b) for (a,b) in l1 if a not in l2]

但是那样不起作用。我期望l3和l4的输出结果是：

l3
[('two', 3),('three', 3),('four', 5)]

l4
[('one', 3),('ten', 3),('twelve', 8)]

希望能得到任何指导。

- nebulousman

3个回答

0

你可以将两个列表放在一个字典中，比较键下的值并构建输出列表：

l1 = [('zero', 0),('one', 2),('two', 3),('three', 3),('four', 5)]
l2 = [('zero', 0),('one', 3),('four', 2),('ten', 3),('twelve', 8)]

# using dicts as lookups needs some performance to build them but then is faster then
# pure list lookups
d1 = dict(l1)
d2 = dict(l2)

# collect things to delete in sets
del1 = set()
del2 = set()

for key in set(d1.keys()).union(d2):
    if key in d1 and key in d2:
        if d1[key] == d2[key]:
            del1.add((key, d1[key]))
            del2.add((key, d1[key]))
            continue

        elif d2[key] >= d1[key]:
            del1.add((key, d1[key]))

        else:
            del2.add((key, d2[key]))

# create the resulting lists
l3 = [i for i in l1 if i not in del1]
l4 = [i for i in l2 if i not in del2]

print(l3) 
print(l4)

输出：

[('two', 3), ('three', 3), ('four', 5)]
[('one', 3), ('ten', 3), ('twelve', 8)]

- Patrick Artner

0


l5 = list(set([i for i in l3 for y in l4 if (i[0]==y[0] and i[1] > y[1]) or (i[0] not in [x[0] for x in l4]) ]))
l6 = list(set([i for i in l4 for y in l3 if (i[0]==y[0] and i[1] > y[1]) or (i[0] not in [x[0] for x in l3]) ]))

print(l5)
print(l6)

>>> [('three', 3), ('four', 5), ('two', 3)]
>>> [('ten', 3), ('twelve', 8), ('one', 3)]

解释：

为了将元素添加到新列表中，必须满足以下条件之一：

(i[0]==y[0] and i[1] > y[1]) or (i[0] not in [x[0] for x in l4]) 必须为真，

i 是 l3 中的元素，y 是 l4 中的元素，此条件是首先如果第一个值匹配并且 i 的第二个值大于 y 的第二个值，则将其添加到列表中，这符合您问题的部分。

如果第一个值匹配，则从第二个值较低的元组中删除该元素

然后条件的第二部分只是添加不在另一个列表中的元素。

我对列表 l6 应用了相同的逻辑。

- coderoftheday

这也可以工作 - 尽管这对我来说不是一个要求，但它不能保持顺序。 - nebulousman

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Dani Mesejo · Accepted Answer

您可以这样做：

d1 = dict(l1)
d2 = dict(l2)

l3 = [(k, v) for k, v in d1.items() if k not in d2 or d2[k] < v]
l4 = [(k, v) for k, v in d2.items() if k not in d1 or d1[k] < v]

print(l3)
print(l4)

输出

[('two', 3), ('three', 3), ('four', 5)]
[('one', 3), ('ten', 3), ('twelve', 8)]

使用字典进行快速查找匹配的第一个值（如果有的话），然后检查相应的第二个值是否小于当前列表中的值。