这是我的数据框的样子:
我想要去除所有金额相等且正负相反的销售,并仅显示剩余的净销售额(最好是在最早日期,但无论如何都没有关系)。我的期望数据框长这样。
df <- read.table(text='
CustomerName Sales TradeDate
John 1000 1/1/2015
John -1000 1/1/2015
John 1000 1/1/2015
John 5000 2/1/2015
John -2000 3/1/2015
John 2000 3/2/2015
John 2000 3/3/2015
John -2000 3/4/2015
John 2000 3/5/2015
John 2000 3/6/2015
John -3000 4/1/2015
John 3000 4/1/2015
John -3000 4/1/2015
John 2000 5/1/2015
John -2000 5/1/2015
John 2000 5/1/2015
Tom 1000 1/1/2015
Tom -1000 1/1/2015
Tom 1000 1/1/2015
Tom 5000 2/1/2015
Tom -2000 3/1/2015
Tom 2000 3/1/2015
Tom -2000 3/1/2015
Tom 2000 3/1/2015
Tom 2000 3/1/2015
Tom -3000 4/1/2015
Tom 3000 4/1/2015
Tom -3000 4/1/2015
', header=T)
我想要去除所有金额相等且正负相反的销售,并仅显示剩余的净销售额(最好是在最早日期,但无论如何都没有关系)。我的期望数据框长这样。
CustomerName Sales TradeDate
John 1000 1/1/2015
John 5000 2/1/2015
John 2000 3/3/2015
John 2000 3/6/2015
John -3000 4/1/2015
John 2000 5/1/2015
Tom 1000 1/1/2015
Tom 5000 2/1/2015
Tom 2000 3/1/2015
Tom -3000 4/1/2015
我选择了从2015年3月3日到2015年3月6日期间的两个2000元(在John的情况下是在三月份),但如果输出为2015年3月2日或2015年3月5日的两个2000元,我也可以接受。非常感谢您的帮助!
n
条带有正确符号的记录)。如果您希望它以不同的方式运作(我可以想象出这种情况),则必须修改代码或选择不同的方法。 - Frank