键 | 值 | 主题 | 分区 |
---|---|---|---|
null | dGVzdF90ZXh0 |
Topic.Name | 0 |
null | dGVzdF90ZXh0 |
Topic.Name | 0 |
null | dGVzdF90ZXh0 |
Topic.Name | 0 |
df_1
我有一个Spark数据框,其中列value
是Base64编码的。 我想能够在数据框的末尾添加一列其未编码版本的内容。
import base64
df_2 = df_1.withColumn('unencoded_base64',base64.b64decode(df_1.value))
上述代码给我报了一个错误:
TypeError: a2b_base64() argument 1 must be convertible to a buffer, not Column
udf
函数进行解码,然后将结果作为一列添加。 - Snail Pacer