我有一个包含600列的pandas数据框(df1),我想将每一列的值分组6个一组进行求和。换句话说,我想创建一个新的数据框(df2),它有100列,每一列都是输入数据框中6列的总和。例如,df2中第一列的每一行都是df1中前六列的总和(保持行分离)。我的数据框中还有每个列名的字符串值(这里只用单个字母表示)。
对于df1:
每一行的值是该行前六列的总和。下一列将是接下来六列的总和,以此类推,每组6列的第一个列名为该组中第一列的名称。(第一列的名称是第一列的名称,第二列的名称是第七列的名称,以此类推。)
我尝试使用列索引来计算正确的列之和,但我无法找到一种方法来将这些总和存储在具有相关名称的新列中。
有没有一种Pythonic的方法来创建这些列,并从df中提取列名到df2中?
对于df1:
A B C D E F G H I J ...
0 9 6 3 4 7 7 6 0 5 2 ...
1 8 0 6 6 0 5 6 5 8 7 ...
2 9 0 7 2 9 5 3 2 1 7 ...
3 5 2 9 6 7 0 3 8 5 0 ...
4 7 1 0 7 4 0 2 0 5 8 ...
5 0 9 2 0 4 9 5 7 6 2 ...
我希望df2的第一列为:
A G ...
0 36
1 25
2 32
3 29
4 19
5 24
每一行的值是该行前六列的总和。下一列将是接下来六列的总和,以此类推,每组6列的第一个列名为该组中第一列的名称。(第一列的名称是第一列的名称,第二列的名称是第七列的名称,以此类推。)
我尝试使用列索引来计算正确的列之和,但我无法找到一种方法来将这些总和存储在具有相关名称的新列中。
有没有一种Pythonic的方法来创建这些列,并从df中提取列名到df2中?