参考pyspark: Difference performance for spark.read.format("csv") vs spark.read.csv
我以为需要使用.options("inferSchema" , "true")
和.option("header", "true")
才能打印出标题,但实际上我仍然可以打印带有标题的csv文件。
标题和模式有什么区别?我不是很理解“inferSchema:自动推断列类型。它需要对数据进行额外的一次遍历,并且默认值为false”的含义。