Pandas：使用[columnname][rownumber]选择数组值仅适用于多重索引

Question

Pandas：使用[columnname][rownumber]选择数组值仅适用于多重索引

pythonpython-3.xpandasindexingmulti-index

3

我尝试使用Pandas中的数据透视表来分析数据。对于多级索引，一切正常。

我有这个数据透视表：

>>>print(pivtab)
           count  win
pp   ps              
8000 8200      4    2
8100 8200      2    1
     8300      3    1

现在，我可以通过以下方法选择“count”列中第二行的值：

>>>print(pivtab["count"][1])
2

意外的行为出现在使用单个索引数据透视表时。该数据透视表如下所示：

      count  win
pp              
8000      4    2
8100      5    2

现在当我尝试使用同样的方式 print(pivtab["count"][1]) 时，出现了一个 KeyError: 1。似乎Python现在不再接受行号，而是行名称（=索引）。使用

>>>print(pivtab["count“][8100])
5

一切正常运作。完整代码如下所示：

import pandas as pd
columns = ["count","game_Id","season","win","pp","ps"]
matrix = pd.DataFrame(columns=columns)
# Create a test matrix
for i in range(1,10):
    win = 0
    if int(i/2) == i/2:
        win = 1
    pprim = 8000
    if i > 4:
        pprim = 8100
    psub = 8200
    if i > 6:
        psub = 8300
    new_row = pd.DataFrame([[1, i, 11, win, pprim, psub]], columns=columns)
    matrix = matrix.append(new_row,ignore_index=True)
print(matrix)
pivtab = pd.pivot_table(matrix, index=["pp","ps"], values=["count","win"], aggfunc="sum")
print("\n", pivtab)
print(pivtab["count"][1])

为了彻底搞糊涂，我尝试了另一个测试矩阵......在这里一切都运行良好！

import pandas as pd
matrix = pd.DataFrame({"A":["hey","hey","boo","boo"], "B":[1,2,3,2], "valueA":[123,441,190,123], "valueB":[5,5,6,6]})
piv_matrix = pd.pivot_table(matrix, index=["A"], values=["valueA","valueB"], aggfunc="sum")
print(piv_matrix)
print("\nValue:", piv_matrix["valueA"][1])

结果：

     valueA  valueB
A                  
boo     313      12
hey     564      10

Value: 564

如果您能为我解释这种意外（至少对我来说）的行为原因，我会很高兴。谢谢！

- Frank

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- jpp · Accepted Answer

不鼓励文档

文档不鼓励链式索引。语法df[label_1][label_2]不应被使用。

替代方案

大多数解决方案涉及基于标签/位置的切片的loc / iloc，或用于访问标量的at / iat。

在您的示例中，您混合了基于标签和基于位置的索引器。相反，您可以选择一个系列并使用iat或iloc：

piv_matrix['valueA'].iat[1]
piv_matrix['valueA'].iloc[1]

这个语法对你的两个例子都适用。