我有一个带有模式的DataFrame
root
|-- label: string (nullable = true)
|-- features: struct (nullable = true)
| |-- feat1: string (nullable = true)
| |-- feat2: string (nullable = true)
| |-- feat3: string (nullable = true)
虽然我能够使用筛选器筛选数据框
val data = rawData
.filter( !(rawData("features.feat1") <=> "100") )
我无法使用
drop
命令删除列。
val data = rawData
.drop("features.feat1")
我在这里做错了什么吗?我还尝试过(不成功地)执行 drop(rawData("features.feat1"))
,尽管这样做没有太多意义。
提前致谢,
Nikhil
.columns()
方法获取所有列,从序列中删除不需要的列,然后执行select(myColumns:_*)
。这样会更简洁一些。 - TheMP