如何在Python中创建不等间距值之间的等间距值?

4

I have an array A (variable) of the form:

A = [1, 3, 7, 9, 15, 20, 24]

现在我想在数组A的值之间创建10个(变量)等间距的值,以便得到形式为数组B的结果:

B = [1, 1.2, 1.4, ... 2.8, 3, 3.4, 3.8, ... , 6.6, 7, 7.2, ..., 23.6, 24]

本质上,B 应该始终具有 A 的值以及在 A 值之间等间距的值。

我通过使用以下代码解决了这个问题:

import numpy as np
A = np.array([1, 3, 7, 9, 15, 20, 24])
B = []
for i in range(len(A) - 1):
    B = np.append(B, np.linspace(A[i], A[i + 1], 11))
print (B)

但是NumPy是否已经有任何函数或者还有其他更好的方法来创建这样的数组呢?
4个回答

8

使用插值作为连接的替代方法:

n = 10
x = np.arange(0, n * len(A), n)       # 0, 10, .., 50, 60
xx = np.arange((len(A) - 1) * n + 1)  # 0, 1, .., 59, 60
B = np.interp(xx, x, A)

结果:

In [31]: B
Out[31]: 
array([  1. ,   1.2,   1.4,   1.6,   1.8,   2. ,   2.2,   2.4,   2.6,
         2.8,   3. ,   3.4,   3.8,   4.2,   4.6,   5. ,   5.4,   5.8,
         6.2,   6.6,   7. ,   7.2,   7.4,   7.6,   7.8,   8. ,   8.2,
         8.4,   8.6,   8.8,   9. ,   9.6,  10.2,  10.8,  11.4,  12. ,
        12.6,  13.2,  13.8,  14.4,  15. ,  15.5,  16. ,  16.5,  17. ,
        17.5,  18. ,  18.5,  19. ,  19.5,  20. ,  20.4,  20.8,  21.2,
        21.6,  22. ,  22.4,  22.8,  23.2,  23.6,  24. ])

这种方法应该比其他解决方案更快,因为它不使用Python for循环,也不会进行多次调用linspace。快速的时间对比:
In [58]: timeit np.interp(np.arange((len(A) - 1) * 10 + 1), np.arange(0, 10*len(A), 10), A)
100000 loops, best of 3: 10.3 µs per loop

In [59]: timeit np.append(np.concatenate([np.linspace(i, j, 10, False) for i, j in zip(A, A[1:])]), A[-1])
10000 loops, best of 3: 94.2 µs per loop

In [60]: timeit np.unique(np.hstack(np.linspace(a, b, 10 + 1) for a, b in zip(A[:-1], A[1:])))
10000 loops, best of 3: 140 µs per loop

3

你可以在列表推导式中使用zip函数和np.concatenate函数。但是,如果你也想包含最后一个元素,你可以使用np.append函数将其添加到列表中:

>>> np.append(np.concatenate([np.linspace(i, j, 10, False) for i,j in zip(A,A[1:])]),A[-1])
array([  1. ,   1.2,   1.4,   1.6,   1.8,   2. ,   2.2,   2.4,   2.6,
         2.8,   3. ,   3.4,   3.8,   4.2,   4.6,   5. ,   5.4,   5.8,
         6.2,   6.6,   7. ,   7.2,   7.4,   7.6,   7.8,   8. ,   8.2,
         8.4,   8.6,   8.8,   9. ,   9.6,  10.2,  10.8,  11.4,  12. ,
        12.6,  13.2,  13.8,  14.4,  15. ,  15.5,  16. ,  16.5,  17. ,
        17.5,  18. ,  18.5,  19. ,  19.5,  20. ,  20.4,  20.8,  21.2,
        21.6,  22. ,  22.4,  22.8,  23.2,  23.6,  24. ])

此外,您可以使用retstep=True来返回(samples, step)的元组,其中step是样本之间的间距。
>>> np.concatenate([np.linspace(i, j, 10, False,retstep=True) for i,j in zip(A,A[1:])])
array([array([ 1. ,  1.2,  1.4,  1.6,  1.8,  2. ,  2.2,  2.4,  2.6,  2.8]),
       0.2,
       array([ 3. ,  3.4,  3.8,  4.2,  4.6,  5. ,  5.4,  5.8,  6.2,  6.6]),
       0.4,
       array([ 7. ,  7.2,  7.4,  7.6,  7.8,  8. ,  8.2,  8.4,  8.6,  8.8]),
       0.2,
       array([  9. ,   9.6,  10.2,  10.8,  11.4,  12. ,  12.6,  13.2,  13.8,  14.4]),
       0.6,
       array([ 15. ,  15.5,  16. ,  16.5,  17. ,  17.5,  18. ,  18.5,  19. ,  19.5]),
       0.5,
       array([ 20. ,  20.4,  20.8,  21.2,  21.6,  22. ,  22.4,  22.8,  23.2,  23.6]),
       0.4], dtype=object)

我认为 OP 想要在这两个数字之间有 10 个等距变量。 - Abid Rahman K

3

基本上是您原始方法的略微简化版本:

print np.hstack(np.linspace(a, b, 10, endpoint=False) for a, b in zip(A[:-1], A[1:]))

输出:

[  1.    1.2   1.4   1.6   1.8   2.    2.2   2.4   2.6   2.8   3.    3.4
   3.8   4.2   4.6   5.    5.4   5.8   6.2   6.6   7.    7.2   7.4   7.6
   7.8   8.    8.2   8.4   8.6   8.8   9.    9.6  10.2  10.8  11.4  12.
  12.6  13.2  13.8  14.4  15.   15.5  16.   16.5  17.   17.5  18.   18.5
  19.   19.5  20.   20.4  20.8  21.2  21.6  22.   22.4  22.8  23.2  23.6]
endpoint参数控制在两个原始值之间是否有9或10个等间距的值。
编辑 由于您希望24位于最后,您可以像Kasra一样append它,或者--为了提供一些变化 ;) --忘记endpoint参数,并生成从ab10 + 1个值。这将自动附加24(因为默认情况下endpoint为true)。(更新:如Bas Swinckels所示,现在需要使用unique来包装它...)
print np.unique(np.hstack(np.linspace(a, b, 10 + 1) for a, b in zip(A[:-1], A[1:])))

[  1.    1.2   1.4   1.6   1.8   2.    2.2   2.4   2.6   2.8   3.
   3.4   3.8   4.2   4.6   5.    5.4   5.8   6.2   6.6   7.    7.2
   7.4   7.6   7.8   8.    8.2   8.4   8.6   8.8   9     9.6  10.2
  10.8  11.4  12.   12.6  13.2  13.8  14.4  15.   15.5  16.   16.5
  17.   17.5  18.   18.5  19.   19.5  20.   20.4  20.8  21.2  21.6
  22.   22.4  22.8  23.2  23.6  24. ]

1
OP希望在结尾处得到24 - Mazdak
1
@Kasra:感谢你的提示!我已经相应地更新了我的答案。 - Falko
1
这也不起作用,现在你有了内部点,例如3个双精度! - Bas Swinckels

0

解决方案代码

该解决方案提出了一种使用广播矩阵乘法的矢量化方法。

基本步骤如下:

  1. 将单位步长区间排除1,即[0,1),分成等步长且长度为steps的元素数组。

  2. 然后,将每个步进数组元素与A的微分相乘,以获取偏移的插值元素的2D数组。

  3. 最后,添加A元素以获取实际的插值值。

这是实现方式-

out2D = (np.diff(A)[:,None]*np.arange(steps)/steps) + A[:-1,None]
out = np.append(out2D,A[-1])

基准测试

所提出的方法似乎比实际插值方法更快,如其他解决方案中建议的那样,对于中等到大型输入数组,因为我们正在使用正则模式来插值。以下是一些运行时测试以确认 -

情况#1:A长度为100steps = 10

In [42]: A = np.sort(np.random.randint(1,100000,(1,100))).ravel()

In [43]: steps = 10

In [44]: %timeit interp_based(A,steps)
100000 loops, best of 3: 18.3 µs per loop

In [45]: %timeit broadcasting_based(A,steps)
100000 loops, best of 3: 19.7 µs per loop

案例 #2: 长度为 500,步数为 10A

In [46]: A = np.sort(np.random.randint(1,100000,(1,500))).ravel()

In [47]: steps = 10

In [48]: %timeit interp_based(A,steps)
10000 loops, best of 3: 101 µs per loop

In [49]: %timeit broadcasting_based(A,steps)
10000 loops, best of 3: 48.8 µs per loop

案例 #3: 长度为 1000A,步数为 20

In [50]: A = np.sort(np.random.randint(1,100000,(1,1000))).ravel()

In [51]: steps = 20

In [52]: %timeit interp_based(A,steps)
1000 loops, best of 3: 345 µs per loop

In [53]: %timeit broadcasting_based(A,steps)
10000 loops, best of 3: 139 µs per loop

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接