我使用的是Spark 2.2.0版本。
我正在按照以下方式读取csv文件:
val dataFrame = spark.read.option("inferSchema", "true")
.option("header", true)
.option("dateFormat", "yyyyMMdd")
.csv(pathToCSVFile)
该文件中有一个日期列,所有记录在该特定列中的值都等于 20171001
。
问题是Spark推断该列的类型为integer
而不是date
。当我删除"inferSchema"
选项时,该列的类型为string
。
该文件中没有null
值,也没有格式错误的行。
这个问题的原因/解决方案是什么?