我该如何向 Pandas 的 Series
实例中添加单个元素?
我需要类似以下这样的代码:
>>> x = Series()
>>> N = 4
>>> for i in xrange(N):
>>> x.some_appending_function(i**2)
>>> print(x)
0 | 0
1 | 1
2 | 4
3 | 9
同样地,我如何向Pandas DataFrame
添加单个行?
我该如何向 Pandas 的 Series
实例中添加单个元素?
我需要类似以下这样的代码:
>>> x = Series()
>>> N = 4
>>> for i in xrange(N):
>>> x.some_appending_function(i**2)
>>> print(x)
0 | 0
1 | 1
2 | 4
3 | 9
同样地,我如何向Pandas DataFrame
添加单个行?
如何添加单个项目。这种方法并不是非常高效,但可以按照您的要求进行操作:
x = p.Series()
N = 4
for i in xrange(N):
x = x.set_value(i, i**2)
生成 x:
0 0
1 1
2 4
3 9
显然有更好的方法一次性生成这个系列。
对于您的第二个问题,请查看SO问题的答案和参考资料add one row in a pandas.DataFrame。
IndexError: index 0 is out of bounds for axis 0 with size 0
。 - Benx = x.set_value(i, i**2)
,因为x.set_value()
会直接更改x
。 - jeongmin.chax.at[i] = i**2
或者x.iat[i] = i**2
。 - Wolfgang Kuehnx[i] = 'some value'
会出错,但在 x.at[i]
的情况下却可以正常工作? series.at[]
的文档也没有提到这方面的任何内容,我认为他们应该加上! - amsquareb简而言之,不要逐个添加序列项,最好使用有序集合进行扩展
In [1]: import pandas as pd
In [2]: import numpy as np
In [3]: s = pd.Series(np.arange(4)**2, index=np.arange(4))
In [4]: s
Out[4]:
0 0
1 1
2 4
3 9
dtype: int64
In [6]: id(s.index), id(s.values)
Out[6]: (4470549648, 4470593296)
当我们更新现有项时,如果您不更改值的类型,则索引和值数组保持不变。
In [7]: s[2] = 14
In [8]: id(s.index), id(s.values)
Out[8]: (4470549648, 4470593296)
但是当您添加一个新项时,会生成一个新的索引和一个新的值数组:
In [9]: s[4] = 16
In [10]: s
Out[10]:
0 0
1 1
2 14
3 9
4 16
dtype: int64
In [11]: id(s.index), id(s.values)
Out[11]: (4470548560, 4470595056)
如果您要追加多个项目,可以将它们收集到字典中,创建一个Series,将其附加到旧的Series并保存结果:
In [13]: new_items = {item: item**2 for item in range(5, 7)}
In [14]: s2 = pd.Series(new_items)
In [15]: s2 # keys are guaranteed to be sorted!
Out[15]:
5 25
6 36
dtype: int64
In [16]: s = s.append(s2); s
Out[16]:
0 0
1 1
2 14
3 9
4 16
5 25
6 36
dtype: int64
append
返回一个新的变量,而赋值则直接修改了数据框。虽然所有底层都在改变,但引用是相同的。 - anishtain4obj = Series([4,7,-5,3])
obj.index=['a', 'b', 'c', 'd']
obj['e'] = 181
这将向Series添加一个新值(在Series末尾)。
您可以使用append函数将另一个元素添加到其中。只需在将其附加之前创建一系列新元素:
test = test.append(pd.Series(200, index=[101]))
append()
方法会返回一个新的Series(而不是原地修改),所以你需要使用test = test.append(pd.Series(200, index=[101]))
来更新它。 - A.Wantest.at[i] = i**2
方法,因为那种方法似乎会按字母顺序插入新值,而这种方法直接将值附加到末尾,这正是我想要的。 - Veggiet>>> import pandas as pd
>>> x = pd.Series()
>>> N = 4
>>> for i in range(N):
... x.at[i] = i**2
>>> print(x)
0 0
1 1
2 4
3 9
x = p.Series()
N = 4
for i in xrange(N):
x[i] = i**2
x = p.Series()
value_to_append = 5
x[len(x)] = value_to_append
import pandas as pd
import numpy as np
ser1 = pd.Series(np.linspace(1, 10, 2))
element = np.nan
ser1 = ser1.append(pd.Series(element))
这里有另一个想法n,可以在不更改系列名称的情况下在一行中附加多个项目。但是,这可能不像其他答案那样有效。
>>> df = pd.Series(np.random.random(5), name='random')
>>> df
0 0.363885
1 0.402623
2 0.450449
3 0.172917
4 0.983481
Name: random, dtype: float64
>>> df.to_frame().T.assign(a=3, b=2, c=5).squeeze()
0 0.363885
1 0.402623
2 0.450449
3 0.172917
4 0.983481
a 3.000000
b 2.000000
c 5.000000
Name: random, dtype: float64