可以使用操作
给出
collect
或 take
来仅打印 DataFrame 中的指定列吗?df.col.collect()
出现错误
类型错误:'Column' 对象不可调用
还有这个:
df[df.col].take(2)
给出
collect
或 take
来仅打印 DataFrame 中的指定列吗?df.col.collect()
出现错误
类型错误:'Column' 对象不可调用
还有这个:
df[df.col].take(2)
select
和 show
:
df.select("col").show()
或者 select
, flatMap
, collect
:
df.select("col").rdd.flatMap(list).collect()
角括号表示法(df[df.col]
)仅用于逻辑切片和列本身(df.col
),不是分布式数据结构,而是SQL表达式,无法进行收集。
df['col'].collect()
有效还是df['col'].take(2)
有效? - EdChum