根据另一个列表中的值,从元组列表中删除重复值

7

我有两个类似这样的列表:

l1 = [('zero', 0),('one', 2),('two', 3),('three', 3),('four', 5)]
l2 = [('zero', 0),('one', 3),('four', 2),('ten', 3),('twelve', 8)]

我想比较这两个列表并

  1. 如果两个值相同,从两个列表中都移除重复项
  2. 如果第一个值匹配,则从列表中删除第二个值较低的元组

我可以用以下方法实现第一个要求:

l3 = [(a,b) for (a,b) in l1 if (a,b) not in l2]
l4 = [(a,b) for (a,b) in l2 if (a,b) not in l1]

或者使用 set,虽然它不能保证顺序。

l3 = set(l1) - set(l2)

但我很难理解第二个。我试图只根据第一个值进行删除。

l3 = [(a,b) for (a,b) in l1 if a not in l2]

但是那样不起作用。我期望l3和l4的输出结果是:
l3
[('two', 3),('three', 3),('four', 5)]

l4
[('one', 3),('ten', 3),('twelve', 8)]

希望能得到任何指导。

3个回答

6
您可以这样做:
d1 = dict(l1)
d2 = dict(l2)

l3 = [(k, v) for k, v in d1.items() if k not in d2 or d2[k] < v]
l4 = [(k, v) for k, v in d2.items() if k not in d1 or d1[k] < v]

print(l3)
print(l4)

输出

[('two', 3), ('three', 3), ('four', 5)]
[('one', 3), ('ten', 3), ('twelve', 8)]

使用字典进行快速查找匹配的第一个值(如果有的话),然后检查相应的第二个值是否小于当前列表中的值。

1
+1!不过你应该将 d1[k] <= vd2[k] <= v 交换一下,这样输出结果才会符合预期。如果你按照 k not in d2 or d1[k] > v 进行分配,可能会更加清晰易懂。 - ssp

0
你可以将两个列表放在一个字典中,比较键下的值并构建输出列表:
l1 = [('zero', 0),('one', 2),('two', 3),('three', 3),('four', 5)]
l2 = [('zero', 0),('one', 3),('four', 2),('ten', 3),('twelve', 8)]

# using dicts as lookups needs some performance to build them but then is faster then
# pure list lookups
d1 = dict(l1)
d2 = dict(l2)

# collect things to delete in sets
del1 = set()
del2 = set()

for key in set(d1.keys()).union(d2):
    if key in d1 and key in d2:
        if d1[key] == d2[key]:
            del1.add((key, d1[key]))
            del2.add((key, d1[key]))
            continue

        elif d2[key] >= d1[key]:
            del1.add((key, d1[key]))

        else:
            del2.add((key, d2[key]))

# create the resulting lists
l3 = [i for i in l1 if i not in del1]
l4 = [i for i in l2 if i not in del2]

print(l3) 
print(l4)

输出:

[('two', 3), ('three', 3), ('four', 5)]
[('one', 3), ('ten', 3), ('twelve', 8)]

0

l5 = list(set([i for i in l3 for y in l4 if (i[0]==y[0] and i[1] > y[1]) or (i[0] not in [x[0] for x in l4]) ]))
l6 = list(set([i for i in l4 for y in l3 if (i[0]==y[0] and i[1] > y[1]) or (i[0] not in [x[0] for x in l3]) ]))

print(l5)
print(l6)

>>> [('three', 3), ('four', 5), ('two', 3)]
>>> [('ten', 3), ('twelve', 8), ('one', 3)]

解释:

为了将元素添加到新列表中,必须满足以下条件之一:

(i[0]==y[0] and i[1] > y[1]) or (i[0] not in [x[0] for x in l4]) 必须为真,

il3 中的元素,yl4 中的元素,此条件是首先如果第一个值匹配并且 i 的第二个值大于 y 的第二个值,则将其添加到列表中,这符合您问题的部分。

如果第一个值匹配,则从第二个值较低的元组中删除该元素

然后条件的第二部分只是添加不在另一个列表中的元素。

我对列表 l6 应用了相同的逻辑。


这也可以工作 - 尽管这对我来说不是一个要求,但它不能保持顺序。 - nebulousman

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接