对于没有意义的行索引的数据集,我发现按行号选择数据并同时使用列名更有用。我知道
例如,我想选择第2行和B列的单元格 - 我不一定知道第2行的行名称是5还是B列是第二列。那么引用该单元格的最佳方法是什么?
(行名称通常是更大数据集的过滤结果或随机样本)
.iloc
只接受行/列编号(整数),而 .loc
只接受名称。但是否有解决方法可以同时使用行号和列名进行组合呢? A B
1 1 a
5 2 a
6 3 a
4 4 b
9 5 b
3 6 b
例如,我想选择第2行和B列的单元格 - 我不一定知道第2行的行名称是5还是B列是第二列。那么引用该单元格的最佳方法是什么?
(行名称通常是更大数据集的过滤结果或随机样本)
df['B'].iloc[2]
吗? - EdChumdf[df.columns[1].iloc[2]
,但问题在于使用整数作为列和行标签可能会变得模糊不清。 - EdChumdf['B'].iloc[2]
可能是解决方案,但您是否知道这种链式索引是否存在与此处标记的相同问题(http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy)? - hurrikaledf.reset_index(drop=True, inplace=True)
将行索引丢弃呢? - smci