在转换之前在R中识别日期格式

3
我有一个简单的数据集,其中包含一个日期列和一个值列。我注意到日期有时以mmddyy(%m/%d/%y)格式出现,有时以mmddYYYY(%m/%d/%Y)格式出现。最好的方法是标准化日期,以便我可以进行其他计算而不会因此格式问题而出现错误?我尝试了这里提供的答案Changing date format in R和这里How to change multiple Date formats in same column,但都无法解决问题。以下是数据样本。
Date, Market
12/17/09,1.703
12/18/09,1.700
12/21/09,1.700
12/22/09,1.590
12/23/2009,1.568
12/24/2009,1.520
12/28/2009,1.500
12/29/2009,1.450
12/30/2009,1.450
12/31/2009,1.450
1/4/2010,1.440

当我使用类似以下方式将其读入新向量时
dt <- as.Date(inp$Date, format="%m/%d/%y")

我得到了上面部分的以下输出结果。
dt                  Market
2009-12-17          1.703
2009-12-18          1.700
2009-12-21          1.700
2009-12-22          1.590
2020-12-23          1.568
2020-12-24          1.520
2020-12-28          1.500
2020-12-29          1.450
2020-12-30          1.450
2020-12-31          1.450
2020-01-04          1.440

正如您所看到的,由于格式变化,我们在12/23从2009年跳到了2020年。感谢任何帮助。


1
如果是我,我会查看日期的长度,如果是8个字符,我会在第6和第7个字符位置之间插入“20”。然后我会将它们全部视为更长的日期,并像老板一样前进。 - jtromans
1个回答

5
> dat$Date <- gsub("[0-9]{2}([0-9]{2})$", "\\1", dat$Date)                                                                                                                                                                                  
> dat$Date <- as.Date(dat$Date, format = "%m/%d/%y")                                                                                                                                                                                        
> dat                                                                                                                                                                                                                                       
          Date Market                                                                                                                                                                                                                         
# 1  2009-12-17  1.703                                                                                                                                                                                                                         
# 2  2009-12-18  1.700                                                                                                                                                                                                                         
# 3  2009-12-21  1.700                                                                                                                                                                                                                         
# 4  2009-12-22  1.590                                                                                                                                                                                                                         
# 5  2009-12-23  1.568                                                                                                                                                                                                                         
# 6  2009-12-24  1.520                                                                                                                                                                                                                         
# 7  2009-12-28  1.500                                                                                                                                                                                                                         
# 8  2009-12-29  1.450                                                                                                                                                                                                                         
# 9  2009-12-30  1.450                                                                                                                                                                                                                         
# 10 2009-12-31  1.450                                                                                                                                                                                                                         
# 11 2010-01-04  1.440  

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接