累积和和进位 - 用pandas向量化

3

我能否在不显式循环的情况下,使用pandas.Series对ab进行数学运算?

In [38]: a = pd.Series([4, 8, 3, 6, 2])

In [39]: b = pd.Series([3, 9, 5, 5, 4])

In [40]: alist = a.tolist()
    ...: blist = b.tolist()
    ...: for i in range(len(alist)):
    ...:     diff = max(0, alist[i] - blist[i])
    ...:     try:
    ...:         alist[i + 1] = alist[i + 1] + diff
    ...:     except IndexError:
    ...:         if diff > 0:
    ...:             alist.append(diff)
    ...:     blist[i] = max(0, blist[i] - alist[i])
    ...: 

In [41]: alist
Out[41]: [4, 9, 3, 6, 3]

In [42]: blist
Out[42]: [0, 0, 2, 0, 1]

如果a-b大于零,我会用a和b的差来增加a的下一个值,并从类似累积总和的计算中减去b。


所有的答案看起来都非常合理。我不知道哪一个是最好的或者如何选择它。 - Vishal
4个回答

2

在IIUc中,你需要使用shift(这一行可以被替换为alist[i + 1] = alist[i + 1] + diff

alist=a.add((a-b).clip(lower=0).shift(),fill_value=0).astype(int)
blist=(b-alist).clip_lower(0)
alist
Out[340]: 
0    4
1    9
2    3
3    6
4    3

blist
Out[341]: 
0    0
1    0
2    2
3    0
4    1

2

这是使用numpy的一种方法:

import numpy as np

a += np.maximum(0, a-b).shift().fillna(0).astype(int)
b = np.maximum(0, b - a)

print(a)

0    4
1    9
2    3
3    6
4    3
dtype: int64

print(b)

0    0
1    0
2    2
3    0
4    1
dtype: int64

1

这里是另一种使用 whereroll 的 numpy 方法:

alist = np.where(np.roll(a - b > 0, 1), a + np.roll(a - b, 1), a)
blist = np.maximum(b.values - alist, 0)

print alist
# [4 9 3 6 3]
print blist
# [0 0 2 0 1]

0
考虑下面的代码,它使用 .shift() 然后 roll()
df=pd.DataFrame({
    'a': a,
    'b': b
})
alist = list(np.roll((df['a'].shift(-1)+(df['a']-df['b']).clip(lower=0)).fillna(df.iloc[0]['a']), 1).astype(int))
blist = list((df['b'] - alist).clip(lower=0))
print(allist)
print(blist)

输出:

[4, 9, 3, 6, 3]
[0, 0, 2, 0, 1]

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接