高效填充数组的方法

3

我想知道在Python中是否有一种高效的方法对数组进行填充,而不使用numpy.pad()

我知道一种使用嵌套for循环的方法,但我想知道是否有更快的方法?

输入:

row padding on top- 2
column padding from left - 1
1 2 3
4 5 6
7 8 9

输出

0 0 0 0
0 0 0 0
0 1 2 3
0 4 5 6
0 7 8 9

我所做的事情

y = [[1,2,3],[4,5,6],[7,8,9]]

topPadding = 2
leftPadding = 1
noOfRows = len(y)+topPadding
noOfCols = len(y)+leftPadding

x = [[0 for i in range(noOfCols)] for j in range(noOfRows)]

for i in range(topPadding,noOfRows):
    for j in range(leftPadding,noOfCols):
        x[i][j] = y[i-topPadding][j-leftPadding]
    print()
        
print(x)

输出

[[0, 0, 0, 0], [0, 0, 0, 0], [0, 1, 2, 3], [0, 4, 5, 6], [0, 7, 8, 9]]

2
numpy.pad 速度太慢了吗? - Paul H
1
这很有道理。但是当没有可比较的东西(例如,您已经尝试过什么)时,“寻求更快的方法”有点含糊不清。 - Paul H
我尝试过的方法是创建一个全新的数组,然后逐个复制元素,时间复杂度为O(n^2),这已经是我能够实现的最优解了吗? - Tharun K
1
我建议您将该代码作为可运行的示例包含在此问题中。 - Paul H
我假设你的输入不是一个Numpy数组,那么它是一个列表吗?最好像@PaulH所说的那样提供一个最小可重现的示例。 - Inputvector
显示剩余5条评论
2个回答

0
一种使用 list 连接和重复运算符的解决方案:
def concat(x, top, left):
    n = len(x[0])
    return [[0]*(n + left - len(row)) + row for row in [[]]*top + x]

下面是使用嵌套for循环解决方案和我的连接解决方案对于一个随机数字10000x10000矩阵的一些非常基本的计时结果:

nested: 122.26 s
concat: 5.66 s

测试的代码:

import timeit
from random import randint


def concat(x, top, left):
    n = len(x[0])
    return [[0]*(n + left - len(row)) + row for row in [[]]*top + x]


def nested(x, topPadding, leftPadding):
    noOfRows = len(x)+topPadding
    noOfCols = len(x)+leftPadding

    z = [[0 for i in range(noOfCols)] for j in range(noOfRows)]

    for i in range(topPadding,noOfRows):
        for j in range(leftPadding,noOfCols):
            z[i][j] = x[i-topPadding][j-leftPadding]

    return z


test = [[randint(0, 9) for _ in range(10000)] for _ in range(10000)]

t1 = timeit.timeit(
    "nested(test, 4, 2)",
    number=10,
    globals=globals()
)

t2 = timeit.timeit(
    "concat(test, 4, 2)",
    number=10,
    globals=globals()
)

print(nested(test, 4, 2) == concat(test, 4, 2))
print(f"nested: {t1:.2f} s")
print(f"concat: {t2:.2f} s")

完整输出:

True
nested: 122.26 s
concat: 5.66 s

一个修改过的版本,您可以输入所需的高度和宽度:

def concat(x, h, w):
    H = h - len(x)
    return [[0]*(w - len(row)) + row for row in [[]]*H + x]

另一种版本允许在北、南、东、西方向上进行填充:

def nsew_concat(x, N, S, E, W):
    """Pad x with zeros to the north, south, east, and west."""
    k = len(x[0])
    stack = [[]]*N + x + [[]]*S
    return [([0]*W + [0]*(k - len(row)) + row + [0]*E) for row in stack]

0
这将适用于任何(非空)矩形矩阵,但不适用于锯齿形数组(其中每行长度不相同)。
def pad_matrix(matrix, element=0, *, left=0, top=0):
    full_width = left + len(matrix[0])
    e = [element]
    return [
        *(e * full_width for i in range(top)),
        *(e * left + row for row in matrix),
    ]

这是一个允许在四个方向上添加填充的版本:

def pad_matrix(matrix, element=0, *, left=0, top=0, right=0, bottom=0):
    full_width = left + len(matrix[0]) + right
    e = [element]
    return [
        *(e * full_width for i in range(top)),
        *(e * left + row + e * right for row in matrix),
        *(e * full_width for i in range(bottom)),
    ]

使用方法如下:pad_matrix(matrix, left=1, top=2)


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接