我有一个CSV文件,其中包含一个日期列,如下所示:
如果我在Spark版本2.4.5中启用了
但在Spark 3.1以下,输出如下。
我查看了Spark文档中的迁移指南,但没有找到关于此事的任何信息。
请问有人能够确认这是一个错误还是我需要使用其他配置吗?
datecol
----------
2021-01-11
2021-02-15
2021-02-10
2021-04-22
如果我在Spark版本2.4.5中启用了
inferSchema
来读取这个文件,我会得到以下模式:root
|-- datecol: timestamp (nullable = true)
但在Spark 3.1以下,输出如下。
root
|-- datecol: string (nullable = true)
我查看了Spark文档中的迁移指南,但没有找到关于此事的任何信息。
请问有人能够确认这是一个错误还是我需要使用其他配置吗?
timestampFormat
选项,但它仅推断出字符串类型。 - Mohana B CinferSchema=true
吗?我可以使用上面的代码获取被推断为时间戳的列。 - blackbishopinferSchema
后它可以工作了!谢谢。 - Mohana B C