我想知道如何处理以下内容,希望您能给些建议。作为Pandas的新手,我感觉目前我的知识和技能水平还不足以处理我下面所述的请求。
我有一个 Pandas 数据框,其中列出了 2000 多个零件编号。对于每个零件,它们的销售年份、月份、销售数量和销售额都有记录。对于每一年,可能会有偶尔缺失的月份。例如在下面展示的数据中,2007 年的 11 月没有销售,同样地,2008 年的 11 和 12 月也缺失了。我想要做的是为每一年插入缺失的月份,并在每个 part_id 组内插入一个包含适当年份、月份和零值的行,用于 Qty 和 Sales。
总共大约有 60200 行数据,涉及约 2000 个零件编号。我不介意花时间开发解决方案,但需要一些指导来帮助我的学习。
我有一个 Pandas 数据框,其中列出了 2000 多个零件编号。对于每个零件,它们的销售年份、月份、销售数量和销售额都有记录。对于每一年,可能会有偶尔缺失的月份。例如在下面展示的数据中,2007 年的 11 月没有销售,同样地,2008 年的 11 和 12 月也缺失了。我想要做的是为每一年插入缺失的月份,并在每个 part_id 组内插入一个包含适当年份、月份和零值的行,用于 Qty 和 Sales。
总共大约有 60200 行数据,涉及约 2000 个零件编号。我不介意花时间开发解决方案,但需要一些指导来帮助我的学习。
index Part_ID Year Month Qty Sales
60182 ZZSSL 2007 5 11.0 724.85
60183 ZZSSL 2007 6 7.0 537.94
60184 ZZSSL 2007 7 17.0 1165.02
60185 ZZSSL 2007 8 3.0 159.56
60186 ZZSSL 2007 9 67.0 4331.28
60187 ZZSSL 2007 10 72.0 4582.98
60188 ZZSSL 2007 12 42.0 2651.42
60189 ZZSSL 2008 1 22.0 1422.32
60190 ZZSSL 2008 2 16.0 1178.98
60191 ZZSSL 2008 3 20.0 1276.60
60192 ZZSSL 2008 4 28.0 2120.84
60193 ZZSSL 2008 5 2.0 83.03
60194 ZZSSL 2008 6 16.0 1250.24
60195 ZZSSL 2008 9 17.0 1323.34
60196 ZZSSL 2008 10 2.0 197.98
60197 ZZSSL 2009 1 21.0 1719.30
60198 ZZSSL 2009 2 1.0 78.15
60199 ZZSSL 2009 3 3.0 281.34
60200 ZZSSL 2009 4 25.0 2214.25
60201 ZZSSL 2009 5 10.0 833.60
60202 ZZSSL 2009 6 1.0 83.36
60203 ZZSSL 2009 7 1.0 83.36