将字符串分割成相等大小的块

Question

将字符串分割成相等大小的块

pythonstringtuples

32

如何将字符串'aaaaaaaaaaaaaaaaaaaaaaa'拆分为长度为4的元组，例如(aaaa,aaaa,aaaa)？

- TeaAnyOne

1

对于 s 中的每个 x : x = s[0:4]; s = s[4:]; print(x) - Swaroop Nagendra

相关：在Python中，迭代列表以块为单位的最“Pythonic”方法是什么？ - jfs

这个回答解决了你的问题吗？如何将字符串每隔n个字符分割一次？ - AMC

10个回答

25

使用列表推导式、生成器表达式:

>>> s = 'aaaaaaaaaaaaaaaaaaaaaaa'
>>> [s[i:i+4] for i in range(0, len(s), 4)]
['aaaa', 'aaaa', 'aaaa', 'aaaa', 'aaaa', 'aaa']

>>> tuple(s[i:i+4] for i in range(0, len(s), 4))
('aaaa', 'aaaa', 'aaaa', 'aaaa', 'aaaa', 'aaa')

>>> s = 'a bcdefghi j'
>>> tuple(s[i:i+4] for i in range(0, len(s), 4))
('a bc', 'defg', 'hi j')

- falsetru

5

您可以使用“grouper recipe”（嵌套迭代器）：zip(*[iter(s)]*4)，具体实现请参考这里。

In [113]: s = 'aaaaaaaaaaaaaaaaaaaaaaa'

In [114]: [''.join(item) for item in zip(*[iter(s)]*4)]
Out[114]: ['aaaa', 'aaaa', 'aaaa', 'aaaa', 'aaaa']

请注意，如果字符串中包含空格，则textwrap.wrap可能不会将s拆分为长度为4的字符串：

In [43]: textwrap.wrap('I am a hat', 4)
Out[43]: ['I am', 'a', 'hat']

使用石斑鱼食谱比使用textwrap更快：

In [115]: import textwrap

In [116]: %timeit [''.join(item) for item in zip(*[iter(s)]*4)]
100000 loops, best of 3: 2.41 µs per loop

In [117]: %timeit textwrap.wrap(s, 4)
10000 loops, best of 3: 32.5 µs per loop

这个石斑鱼配方可以与任何迭代器一起使用，而textwrap仅适用于字符串。

- unutbu

5

使用正则表达式的另一种解决方案：

>>> s = 'aaaaaaaaaaaaaaaaaaaaaaa'
>>> import re
>>> re.findall('[a-z]{4}', s)
['aaaa', 'aaaa', 'aaaa', 'aaaa', 'aaaa']
>>>

- James Sapam

7

针对这个情况，使用正则表达式有些过头了。 - poke

业主只是在寻求解决方案，而不是最优解，所以我只是提供了我们可以用这种方式解决的方法。没关系，我知道这不是最好的解决方案。 - James Sapam

实际上，这是一个非常好的解决方案（除了在批量使用时正则表达式会变慢），并且比zip()解决方案更容易一眼理解。它甚至可以轻松地更改为使用任意字符，包括换行符：re.findall('.{4}', s, re.DOTALL) - 或者接受不完整的尾部：re.findall('.{1,4}', s, re.DOTALL)。 - blubberdiblub

1

s = 'abcdefghi'

k - 字符串的部分数量

k = 3

parts - 用于存储字符串部分的列表

parts = [s[i:i+k] for i in range(0, len(s), k)]

部件 --> ['abc'，'def'，'ghi']

- Himanshu

0

s = 'abcdef'

我们需要将其分成两部分。

[s[pos:pos+2] for pos,i in enumerate(list(s)) if pos%2 == 0]

答案：

['ab', 'cd', 'ef']

- Arindam Roychowdhury

0

简单易懂的方式

def wrap(string, max_width):
    i=0
    strings = []
    s = ""
    for x in string:
        i+=1
        if i == max_width:
            s = s + x
            strings.append(s)
            s = ""
            i = 0
        else:
            s = s + x
    strings.append(s)
    return strings

wrap('ABCDEFGHIJKLIMNOQRSTUVWXYZ',4)
# output: ['ABCD', 'EFGH', 'IJKL', 'IMNO', 'QRST', 'UVWX', 'YZ']

- CodeNewbie

0

这里是给定问题的另一个可能解决方案：

def split_by_length(text, width):
    width = max(1, width)
    chunk = ""
    for v in text:
        chunk += v
        if len(chunk) == width:
            yield chunk
            chunk = ""

    if chunk:
        yield chunk

if __name__ == '__main__':
    x = "123456789"
    for i in range(20):
        print(i, list(split_by_length(x, i)))

输出：

0 ['1', '2', '3', '4', '5', '6', '7', '8', '9']
1 ['1', '2', '3', '4', '5', '6', '7', '8', '9']
2 ['12', '34', '56', '78', '9']
3 ['123', '456', '789']
4 ['1234', '5678', '9']
5 ['12345', '6789']
6 ['123456', '789']
7 ['1234567', '89']
8 ['12345678', '9']
9 ['123456789']
10 ['123456789']
11 ['123456789']
12 ['123456789']
13 ['123456789']
14 ['123456789']
15 ['123456789']
16 ['123456789']
17 ['123456789']
18 ['123456789']
19 ['123456789']

- BPL

0

我认为这种方法更简单。但是消息长度必须按照 split_size 进行分割。或者可以在消息中添加字母。例如：message =“lorem ipsum_”，然后可以删除添加的字母。

message = "lorem ipsum"

array = []

temp = ""

split_size = 3

for i in range(1, len(message) + 1):
    temp += message[i - 1]

    if i % split_size == 0:
        array.append(temp)
        temp = ""

print(array)

输出： ['lor', 'em ', 'ips']

- miragessee

0

这个函数使用递归。

s = 'dasffvvcsadcadscsdsdcsadssdfsdfsdfdfs'

delimiter = 5

def reccursive_split(data, delimiter, current_list = []):
    if len(data) > delimiter:
        current_list.append(data[:delimiter])
        return reccursive_split(data[delimiter:], delimiter, current_list)
    else:
        current_list.append(data)
        return current_list

print(reccursive_split(s, delimiter))

- Michael Provenzano

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Ashwini Chaudhary · Accepted Answer

使用textwrap.wrap函数：

>>> import textwrap
>>> s = 'aaaaaaaaaaaaaaaaaaaaaaa'
>>> textwrap.wrap(s, 4)
['aaaa', 'aaaa', 'aaaa', 'aaaa', 'aaaa', 'aaa']