根据列表内的条件合并列表项

Question

根据列表内的条件合并列表项

3

我有一个物品清单：例如：

a = ['IP 123 84', 'apple', 'mercury', 'IP 543 65', 'killer', 'parser', 'goat',
     'IP 549 54 pineapple', 'django', 'python']

我想根据条件合并列表项，即合并所有项直到以IP开头的项目。我想要的输出是：

a = ['IP 123 84 apple mercury', 'IP 543 65 killer parser goat',
     'IP 549 54 pineapple django python']

请提供如何做到这一点的建议。

- Kumar Roshan Mehta

4个回答

2

使用生成器。

def merge(x, key='IP'):
    tmp = []
    for i in x:
        if (i[0:len(key)] == key) and len(tmp):
            yield ' '.join(tmp)
            tmp = []
        tmp.append(i)
    if len(tmp):
        yield ' '.join(tmp)

a = ['IP 123 84','apple','mercury','IP 543 65','killer','parser','goat','IP 549 54 pineapple','django','python']
print list(merge(a))

['IP 123 84 apple mercury', 'IP 543 65 killer parser goat', 'IP 549 54 pineapple django python']

- M4rtini

0

如果字符串“IP”仅存在于列表a的某些元素的开头，则连接该列表，然后拆分它：

In [99]: ['IP'+i for i in ''.join(a).split('IP')[1:]]
Out[99]: 
['IP 123 84applemercury',
 'IP 543 65killerparsergoat',
 'IP 549 54 pineappledjangopython']

如果a像

a = ['IP 123 84', 'apple', 'mercury', 'IP 543 65', 'killer', 'parserIP', 'goat',
     'IP 549 54 pineapple', 'django', 'python']                    ^^^^

之前的解决方案行不通，你可以在a中插入一些特殊序列（这些序列在a中永远不会出现），然后连接并拆分它：

In [11]: for i, v in enumerate(a):
    ...:     if v.startswith('IP'):
    ...:         a[i]='$$$'+v
    ...: ''.join(a).split('$$$')[1:]
Out[11]: 
['IP 123 84applemercury',
 'IP 543 65killerparsergoat',
 'IP 549 54 pineappledjangopython']

- zhangxaochen

如果 'IP' 在某些 a 元素中的某个位置，该怎么办？ - David Unric

如果“IP”作为子字符串存在，则此操作将失败。将列表项连接起来，直到该行以“IP”开头。 - Kumar Roshan Mehta

0

import re    
def group_IP_list(lst):
    groups = []
    word_group = []
    for list_item in lst:
        if re.search(r'^IP',list_item) and word_group:
            groups.append(' '.join(word_group)) 
        elif re.search(r'^IP',list_item):
            word_group = [list_item]
        else: 
            word_group.extend([list_item])
    groups.append(' '.join(word_group)) 
    return groups

#Usage: 
a = ['IP 123 84','apple','mercury','IP 543 65','killer','parser','goat','IP 549 54   pineapple','django','python']
print group_IP_list(a)
#Result:
['IP 123 84 apple mercury', 'IP 123 84 apple mercury killer parser goat', 'IP 123 84 apple mercury killer parser goat django python']

- Okezie

如果“IP”在某些a元素中的某个位置，该怎么办？ - Kumar Roshan Mehta

已经考虑到了。我正在使用正则表达式搜索字符串的开头（re.search('^IP')）。插入符号（^）只会匹配字符串的开头；其他任何位置都不会匹配。 - Okezie

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- roippi · Accepted Answer

一种有趣的做法：

import itertools

def predicate_grouper(li, predicate='IP'):
    indices = [i for i,x in enumerate(li) if x.startswith(predicate)]
    slices = [slice(*x) for x in itertools.zip_longest(indices,indices[1:])]
    for sli in slices:
        yield ' '.join(li[sli])

演示：

list(predicate_grouper(a))
Out[61]: 
['IP 123 84 apple mercury',
 'IP 543 65 killer parser goat',
 'IP 549 54 pineapple django python']