使用 Pandas apply 函数获取行的列。

3

问题

大家好,这个问题与这个问题密切相关。与获取Seriesname不同,现在我想要获取每个特定Seriesindex。我尝试过使用x.index,但它返回的是一系列的索引而非该特定单元格的index

In [14]: df = pd.DataFrame({
    ...:     'X': [1,2,3,4,5],
    ...:     'Y': [3,4,5,6,7],
    ...:     'Z': [5,6,7,8,9]}, index=['a', 'b', 'c', 'd', 'e'])

In [15]: df
Out[15]: 
   X  Y  Z
a  1  3  5
b  2  4  6
c  3  5  7
d  4  6  8
e  5  7  9

In [15]: df.apply(lambda x: (x.name, x.index), axis=1)
Out[15]: 
a    (a, [X, Y, Z])
b    (b, [X, Y, Z])
c    (c, [X, Y, Z])
d    (d, [X, Y, Z])
e    (e, [X, Y, Z])
dtype: object

期望输出

我想要实现如下格式。然而,我不确定如何访问特定行的index。如果使用x.index,会返回指数值的列表。

正如你在示例中看到的那样,我只想获取每个单元格的值为(index, column), value

   X           Y          Z
a  (a, X), 1  (a, Y), 3  (a, Z), 5
b  (b, X), 2  (b, Y), 4  (b, Z), 6
c  (c, X), 3  (c, Y), 5  (c, Z), 7
d  (d, X), 4  (d, Y), 6  (d, Z), 8
e  (e, X), 5  (e, Y), 7  (e, Z), 9

试验

我已经尝试过以下方法,但由于索引是硬编码的,所以它不起作用。我还查看了索引文档,但找不到适合这种需求的属性。

In [35]: df.apply(lambda x: (x.name, x.index[0]), axis=1)
Out[35]: 
a    (a, X)
b    (b, X)
c    (c, X)
d    (d, X)
e    (e, X)
dtype: object

In [36]: df.apply(lambda x: (x.name, x.index[1]), axis=1)
Out[36]: 
a    (a, Y)
b    (b, Y)
c    (c, Y)
d    (d, Y)
e    (e, Y)
dtype: object

In [37]:

我认为可以通过迭代每一列并重新分配其中的值来实现此操作。但是,是否有一种使用apply()方法来实现这个功能的方式呢?谢谢!


3
我有点困惑于你所期望的输出结果。为什么每个元组的第一个元素都是'a'?难道不应该与同一行中的索引匹配吗? - Derek O
啊,是的,@Derek,你说得对,已在修订版中修复。 - Toto Lele
1个回答

2
您可以直接修改row系列并返回修改后的row系列。
def convert(row):
    for col in row.index:
        row[col] = f'({row.name}, {col}), {row[col]}'
    return row

df = df.apply(convert, axis=1)

print(df)

           X          Y          Z
a  (a, X), 1  (a, Y), 3  (a, Z), 5
b  (b, X), 2  (b, Y), 4  (b, Z), 6
c  (c, X), 3  (c, Y), 5  (c, Z), 7
d  (d, X), 4  (d, Y), 6  (d, Z), 8
e  (e, X), 5  (e, Y), 7  (e, Z), 9

谢谢你的回答。我很好奇,因为每列/行都有一个循环,这会如何影响算法的时间/空间复杂度?我问这个问题是因为我将处理的数据不太小而且相对较大,性能会稍微受到一些关注。 - Toto Lele
3
假设你有一个名为“TotoLele”的对象,它说过:如果你的数据框有“m”行和“n”列,时间复杂度将为“O(m*n)”。 - Ynjxsjmh

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接