我有一些包含客户购买历史及其每个订单的销售价值的数据。我希望能够对每个客户的开支随时间的变化趋势进行分析。我想到了对每个客户进行回归并在之后提取系数。请问用pandas是否可以高效地实现这一过程(我的数据中大约有1000000个交易)?如果可以,如何实现?
为了更好地理解,这是数据的结构。
这是交易数据的结构,其中还有其他不需要的列。数据很遗憾地只有按月份分类,所以日期格式如下:20xx-xx-01。
现在我想要一个数组,为每个客户提供基于整个交易数据时间间隔内销售价值的回归系数。因此基本上就像这样:
(趋势系数的数字当然仅用于演示)
谢谢您的帮助!
为了更好地理解,这是数据的结构。
Date Customer_ID Sales_Value
2014-07-01 1 62.946002
2014-12-01 2 62.947733
2013-05-01 3 27.328221
2015-01-01 1 30.023658
这是交易数据的结构,其中还有其他不需要的列。数据很遗憾地只有按月份分类,所以日期格式如下:20xx-xx-01。
现在我想要一个数组,为每个客户提供基于整个交易数据时间间隔内销售价值的回归系数。因此基本上就像这样:
Customer_ID trend_coeff
1 -0,5
2 0
3 0
(趋势系数的数字当然仅用于演示)
谢谢您的帮助!