我想从一个列表中删除特定的重复项。如果使用Perl,我会使用以下代码来完成这个任务:
my @list = ( 'a1', 'a1', 'b1', 'b1' );
my %seen;
@list = grep( !/a\d/ || !$seen{ $_ }++, @list );
期望的结果应该是这样的:
@list = ( 'a1', 'b1', 'b1' );
我该如何使用正则表达式和列表推导在Python 3中完成这个操作?谢谢。
我想从一个列表中删除特定的重复项。如果使用Perl,我会使用以下代码来完成这个任务:
my @list = ( 'a1', 'a1', 'b1', 'b1' );
my %seen;
@list = grep( !/a\d/ || !$seen{ $_ }++, @list );
期望的结果应该是这样的:
@list = ( 'a1', 'b1', 'b1' );
itertools.chain
和 groupby
:>>> list(chain(*[[i[0]] if 'a1' in i else i for i in [list(g) for _,g in groupby(sorted(l))]]))
['a1', 'b1', 'b1']
如果您只想使用正则表达式
,可以连接元素,然后使用re.sub
,但请注意,它仅适用于这种特殊情况!即,
是分隔符!:
>>> l =['a1', 'a1', 'b1', 'b1']
>>> re.sub(r'(a1,)+','a1,',','.join(sorted(l))).split(',')
['a1', 'b1', 'b1']
import re
from functools import reduce # this import is not needed in python 2.*
l = ['a1', 'a1', 'b1', 'b1']
print reduce(lambda acc, el: acc if re.match(r'a\d', el) and el in acc else acc + [el], l, [])
抱歉,这个解决方案没有使用列表推导式。这是严格要求的吗?
list(set(stuff))
从 stuff
中生成一个独特事物的列表(因为set
自动去重)。In [1]: import re
In [2]: l = ["a1", "a1", "b1", "b1"]
In [3]: items_to_dedupe = [x for x in l if re.match(r"a\d", x)]
In [4]: leave_alone = [x for x in l if x not in items_to_dedupe]
In [5]: list(set(items_to_dedupe)) + leave_alone
Out[5]: ['a1', 'b1', 'b1']
/a\d/
时,该代码是否会删除重复项,但否则呢? - senshin