我有一个数据集,看起来像这样:
shop_id,item_id,time,value
150,1,2015-07-10,3
150,1,2015-07-11,5
150,1,2015-07-13,2
150,2,2015-07-10,15
150,2,2015-07-12,12
每个由“shop_id”和“item_id”定义的组中都存在缺失的日期。
我希望在每个组内将这个不规则的时间序列扩展为一个连续的时间序列,使其包含连续的日期:
shop_id,item_id,time,value
150,1,2015-07-10,3
150,1,2015-07-11,5
150,1,2015-07-12,0 # <~~ added
150,1,2015-07-13,2
150,2,2015-07-10,15
150,2,2015-07-11,0 # <~~ added
150,2,2015-07-12,12
对于添加的日期,相应的值应该为零。我读过非常类似的问题(使用R或SQL合并),但我看到的大多数解决方案都不涉及GROUP BY。
基本上,我可以访问SQL数据库/我可以将其导出为CSV进行操作,最好是在C#中。希望找到可以进行此类数据操作的C#库,但找不到任何内容。
任何建议或帮助都将不胜感激!