根据列表内的条件合并列表项

3

我有一个物品清单: 例如:

a = ['IP 123 84', 'apple', 'mercury', 'IP 543 65', 'killer', 'parser', 'goat',
     'IP 549 54 pineapple', 'django', 'python']

我想根据条件合并列表项,即合并所有项直到以IP开头的项目。 我想要的输出是:

a = ['IP 123 84 apple mercury', 'IP 543 65 killer parser goat',
     'IP 549 54 pineapple django python']

请提供如何做到这一点的建议。
4个回答

2

一种有趣的做法:

import itertools

def predicate_grouper(li, predicate='IP'):
    indices = [i for i,x in enumerate(li) if x.startswith(predicate)]
    slices = [slice(*x) for x in itertools.zip_longest(indices,indices[1:])]
    for sli in slices:
        yield ' '.join(li[sli])

演示:

list(predicate_grouper(a))
Out[61]: 
['IP 123 84 apple mercury',
 'IP 543 65 killer parser goat',
 'IP 549 54 pineapple django python']

正是我所需要的。 我正在使用Python 2.7,而不是itertools.zip_longest(),我需要使用itertools.izip_longest()。 - Kumar Roshan Mehta
我认为上面的例子中应该使用enumerate(li),而不是enumerate(a)。 - sfortney

2
使用生成器。
def merge(x, key='IP'):
    tmp = []
    for i in x:
        if (i[0:len(key)] == key) and len(tmp):
            yield ' '.join(tmp)
            tmp = []
        tmp.append(i)
    if len(tmp):
        yield ' '.join(tmp)

a = ['IP 123 84','apple','mercury','IP 543 65','killer','parser','goat','IP 549 54 pineapple','django','python']
print list(merge(a))

['IP 123 84 apple mercury', 'IP 543 65 killer parser goat', 'IP 549 54 pineapple django python']

0
如果字符串“IP”仅存在于列表a的某些元素的开头,则连接该列表,然后拆分它:
In [99]: ['IP'+i for i in ''.join(a).split('IP')[1:]]
Out[99]: 
['IP 123 84applemercury',
 'IP 543 65killerparsergoat',
 'IP 549 54 pineappledjangopython']

如果a像

a = ['IP 123 84', 'apple', 'mercury', 'IP 543 65', 'killer', 'parserIP', 'goat',
     'IP 549 54 pineapple', 'django', 'python']                    ^^^^

之前的解决方案行不通,你可以在a中插入一些特殊序列(这些序列在a中永远不会出现),然后连接并拆分它:

In [11]: for i, v in enumerate(a):
    ...:     if v.startswith('IP'):
    ...:         a[i]='$$$'+v
    ...: ''.join(a).split('$$$')[1:]
Out[11]: 
['IP 123 84applemercury',
 'IP 543 65killerparsergoat',
 'IP 549 54 pineappledjangopython']

如果 'IP' 在某些 a 元素中的某个位置,该怎么办? - David Unric
如果“IP”作为子字符串存在,则此操作将失败。将列表项连接起来,直到该行以“IP”开头。 - Kumar Roshan Mehta

0
import re    
def group_IP_list(lst):
    groups = []
    word_group = []
    for list_item in lst:
        if re.search(r'^IP',list_item) and word_group:
            groups.append(' '.join(word_group)) 
        elif re.search(r'^IP',list_item):
            word_group = [list_item]
        else: 
            word_group.extend([list_item])
    groups.append(' '.join(word_group)) 
    return groups

#Usage: 
a = ['IP 123 84','apple','mercury','IP 543 65','killer','parser','goat','IP 549 54   pineapple','django','python']
print group_IP_list(a)
#Result:
['IP 123 84 apple mercury', 'IP 123 84 apple mercury killer parser goat', 'IP 123 84 apple mercury killer parser goat django python']

如果“IP”在某些a元素中的某个位置,该怎么办? - Kumar Roshan Mehta
已经考虑到了。我正在使用正则表达式搜索字符串的开头(re.search('^IP'))。插入符号(^)只会匹配字符串的开头;其他任何位置都不会匹配。 - Okezie

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接