我有一个简单的数据集,其中包含一个日期列和一个值列。我注意到日期有时以mmddyy(%m/%d/%y)格式出现,有时以mmddYYYY(%m/%d/%Y)格式出现。最好的方法是标准化日期,以便我可以进行其他计算而不会因此格式问题而出现错误?我尝试了这里提供的答案Changing date format in R和这里How to change multiple Date formats in same column,但都无法解决问题。以下是数据样本。
当我使用类似以下方式将其读入新向量时
我得到了上面部分的以下输出结果。
Date, Market
12/17/09,1.703
12/18/09,1.700
12/21/09,1.700
12/22/09,1.590
12/23/2009,1.568
12/24/2009,1.520
12/28/2009,1.500
12/29/2009,1.450
12/30/2009,1.450
12/31/2009,1.450
1/4/2010,1.440
当我使用类似以下方式将其读入新向量时
dt <- as.Date(inp$Date, format="%m/%d/%y")
我得到了上面部分的以下输出结果。
dt Market
2009-12-17 1.703
2009-12-18 1.700
2009-12-21 1.700
2009-12-22 1.590
2020-12-23 1.568
2020-12-24 1.520
2020-12-28 1.500
2020-12-29 1.450
2020-12-30 1.450
2020-12-31 1.450
2020-01-04 1.440
正如您所看到的,由于格式变化,我们在12/23从2009年跳到了2020年。感谢任何帮助。