作为一个 R 的初学者,我正在努力调试晦涩难懂的 R 错误。我有一个包含150k行的csv文件,我将其加载到名为"date"的数据框中。然后我使用lubridate将此字符列转换为日期时间,以便找到最小/最大日期。
dates <- csv[c('datetime')]
dates$datetime <- ymd_hms(dates$datetime)
运行此代码,我收到以下错误信息:
Warning message:
3 failed to parse.
我接受这个,因为CSV文件中可能有一些杂乱的日期,在下一次运行时:
min(dates$datetime)
max(dates$datetime)
这两个都返回 NA,我想这是由于数据框中仍存储着一些损坏的日期。我已经搜索了一些快速修复的方法,甚至尝试构建一个 foreach 循环来识别问题日期,但都没有成功。有什么简单的方法可以识别这三个损坏的日期吗?
example date format: 2015-06-17 17:10:16 +0000
?guess_formats
。 - akrunwhich(is.na(dates$datetime))
来找到缺失日期的行号。 - Stibu