Pandas：创建DataFrame时不自动按字母顺序排序列名

Question

Pandas：创建DataFrame时不自动按字母顺序排序列名

15

我正在创建一个初始的pandas数据框来存储从其他代码生成的结果，例如:

result = pd.DataFrame({'date': datelist, 'total': [0]*len(datelist), 
                       'TT': [0]*len(datelist)})

使用预定义列表datelist，其他代码将为每个date输出一些数字，存储在result数据帧中的total和TT中。

因此，我想要第一列是date，第二列是total，第三列是TT。然而，创建时Pandas会自动按字母顺序重新排序为TT，date，total。虽然可以之后手动重新排序，但我想知道是否有更简单的方法在一步中实现这一点。

我发现也可以这样做

result = pd.DataFrame(np.transpose([datelist, [0]*l, [0]*l]),
                      columns = ['date', 'total', 'TT'])

但它看起来有点乏味。还有其他建议吗？

- hurrikale

如果我使用df = pd.DataFrame(columns = ['b','a'])，它将保留顺序，但如果我使用df = pd.DataFrame(columns = {'b','a'})，列名的顺序将被更改为'a' 'b'，这背后有什么原因吗？ - Jason Goal

3个回答

3

result = pd.DataFrame({'date': [23,24], 'total': 0,
                       'TT': 0},columns=['date','total','TT'])

- python必须死

2

请使用 pandas >= 0.23 与 Python >= 3.6 结合使用。

以下代码可以保留字典的插入顺序，从而创建一个 DataFrame（或 Series），当使用 pandas v0.23.0 与 Python3.6 结合使用时。

``` result = pd.DataFrame({'date': datelist, 'total': [0]*len(datelist), 'TT': [0]*len(datelist)}) ```

请参阅 https://pandas.pydata.org/pandas-docs/version/0.23.0/whatsnew.html#whatsnew-0230-api-breaking-dict-insertion-order。

- kadee

3

有一个注意点，它适用于字典中的列表，但不适用于字典的列表。即使所有字典都具有相同的插入顺序，列仍按字母顺序排序。（已在pandas 0.24.2和Python 3.7下测试） - hugovdberg

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- wonce · Accepted Answer

您可以将按正确顺序排列的列列表作为参数传递给构造函数或使用OrderedDict：

# option 1:
result = pd.DataFrame({'date': datelist, 'total': [0]*len(datelist), 
                   'TT': [0]*len(datelist)}, columns=['date', 'total', 'TT'])

# option 2:
od = collections.OrderedDict()
od['date'] = datelist
od['total'] = [0]*len(datelist)
od['TT'] = [0]*len(datelist)
result = pd.DataFrame(od)