我正在处理一个数据集,其中包含每个FMCG类别的总销售额以及它在各主要渠道上的销售分布情况,如下所示:
CTY totsal MTsal GTsal Othsal totsal MTsal GTsal Othsal
food food food food deo deo deo deo
Arg 47313 19620 15052 12641 178 113 41 24
Aus 143140 85172 4634 53334 459 438 5 16
Bel 125399 82966 7818 34614 424 229 5 190
在我的输出数据集中,我希望计算每个第4列所在的总类别组的份额,例如totsal food和totsal deo。因此,这些产品的份额必须为1,而加起来总和的渠道的份额应为它们各自的值。我要查看的示例输出如下:
CTY totshar MTshar GTshar Othshar totshar MTshar GTshar Othshar
food food food food deo deo deo deo
Arg 1 0.4 0.3 0.3 1.0 0.6 0.2 0.1
Aus 1 0.6 0.0 0.4 1.0 1.0 0.0 0.0
Bel 1 0.7 0.1 0.3 1.0 0.5 0.0 0.4
上面的例子是一个摘录,我需要增加灵活性以包括尽可能多的类别和国家。
dput(head(df))
) - RoyalTS