已经有几个与此相关的SO问题,尤其是这个,但是没有一个答案对我有效,而且很多文档链接(特别是关于lexsorting的)都已经失效了,所以我会再问一个问题。
我试图做一些(看起来)非常简单的事情。考虑以下MultiIndexed数据框:
import pandas as pd; import random
arrays = [['bar', 'bar', 'baz', 'baz', 'foo', 'foo', 'qux', 'qux'],
['one', 'two', 'one', 'two', 'one', 'two', 'one', 'two']]
tuples = list(zip(*arrays))
index = pd.MultiIndex.from_tuples(tuples, names=['first', 'second'])
df = pd.concat([pd.Series(np.random.randn(8), index=index), pd.Series(np.random.randn(8), index=index)], axis=1)
现在我想将类别为“one”的所有观测值中列
0
的值设置为某个值(比如np.NaN
)。我尝试了以下方法但失败了:df.loc(axis=0)[:, "one"][0] = 1 # setting with copy warning
并且
df.loc(axis=0)[:, "one", 0] = 1
要解决这个问题,需要注意键的长度是否超过了索引的长度,或者缺少足够深度的词法排序。正确的做法是什么呢?