我有一个名为df1的Spark DataFrame,它大约有1000个String类型的列。现在我想根据列名的条件将df1的列类型从字符串转换为其他类型,例如double、int等等。例如,假设df1仅有三个字符串类型的列。
df1.printSchema
col1_term1: String
col2_term2: String
col3_term3: String
更改列类型的条件是,如果列名包含term1,则将其更改为int,如果列名包含term2,则将其更改为double等等。我对Spark不熟悉。
alias
,例如col(x).cast(IntegerType).alias(x)
。 - Psidom