我对Pandas相对较新,已经尝试过搜索,但没有找到解决方案。 我有一个包含交易编号、客户编号和购买日期的数据框,看起来像这样:
Transaction 12345 12346 12347 12348 12349
customerID
1 NaN 2019-09-01 NaN 2019-09-11 2019-09-22...
2 2019-10-01 NaN NaN NaN 2019-10-07...
3 ...
数据框中有[6334行 x 8557列]。每一行都有NaN值,因为交易号是唯一的。
我想计算每一行的日期差异,以便得到
customerID Datedifference1 Datedifference2 etc.
1 10 11
2 6
3 ...
我正在苦苦尝试获取每个客户的日期差异列表。 是否有一种方法可以忽略数据框中的NaN,仅在非NaN的值上计算? 我想要一个包含customerId和购买1和2之间、2和3之间等日期差异的列表,以估计下一次购买发生的天数。
是否有解决办法?
customerID
而不是Transaction
,它会如何工作? - jezrael