根据条件，将pandas数据框中的多列合并。

Question

根据条件，将pandas数据框中的多列合并。

4

I have a pandas dataframe as follows:

dataframe = pd.DataFrame(
    {
    'ID': [1,2,3,4],
    'Gender': ['F','F','M','M'],
    'Language': ['EN', 'ES', 'EN', 'EN'],
    'Year 1': [2020,2020,2020,2020],
    'Score 1': [93,97,83,86],
    'Year 2': [2020,2020,None,2018],
    'Score 2': [85,95,None,55],
    'Year 3': [2020,2018,None,None],
    'Score 3': [87,86,None,None]
    }
)

ID	性别	语言	年份1	分数1	年份2	分数2	年份3	分数3
1	F	EN	2020	93	2020	85	2020	87
2	F	ES	2020	97	2020	95	2018	86
3	M	EN	2020	83
4	M	EN	2020	86	2018	55

我想根据年份和相应的分数进行融合，例如如果任何一个年份等于2020，则将生成以下内容：

ID	性别	语言	年份	分数
1	F	EN	2020	93
1	F	EN	2020	85
1	F	EN	2020	87
2	F	ES	2020	97
2	F	ES	2020	95
3	M	EN	2020	83
4	M	EN	2020	86

我已经尝试使用 pd.melt，但是我在筛选跨列年份并保留相应条目方面遇到了问题。

- josh453

2个回答

0

long_df = (pd.wide_to_long(dataframe, stubnames=["Year","Score"],i="ID", j="Repetition",
                           sep = " ").reset_index())
df_2020 = (long_df[long_df["Year"] == 2020].drop("Repetition",
                                                 axis=1).sort_values("ID").reset_index(drop=True))

print(df_2020)

   ID Gender Language    Year  Score
0   1      F       EN  2020.0   93.0
1   1      F       EN  2020.0   85.0
2   1      F       EN  2020.0   87.0
3   2      F       ES  2020.0   97.0
4   2      F       ES  2020.0   95.0
5   3      M       EN  2020.0   83.0
6   4      M       EN  2020.0   86.0

- Jon S

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- anky · Accepted Answer

据我所了解，你可以尝试以下方法：

out = (pd.wide_to_long(dataframe,['Year','Score'],['ID','Gender','Language'],'v',' ')
                                               .dropna().droplevel(-1).reset_index())

print(out)

   ID Gender Language    Year  Score
0   1      F       EN  2020.0   93.0
1   1      F       EN  2020.0   85.0
2   1      F       EN  2020.0   87.0
3   2      F       ES  2020.0   97.0
4   2      F       ES  2020.0   95.0
5   2      F       ES  2018.0   86.0
6   3      M       EN  2020.0   83.0
7   4      M       EN  2020.0   86.0
8   4      M       EN  2018.0   55.0