如何在Spark Python中将两个字符串列连接为一列

4
我想将数据框中的两列连接成一列,这里我想将 nameFirst 和 nameLast 合并为名为 FULL Name 的列。
+---------+---------+--------+
| playerID|nameFirst|nameLast|
+---------+---------+--------+
|aardsda01|    David| Aardsma|
|aaronha01|     Hank|   Aaron|
|aaronto01|   Tommie|   Aaron|
| aasedo01|      Don|    Aase|
+---------+---------+--------+

我正在尝试这段代码:
sqlContext.sql("SELECT playerID,(nameFirst+nameLast) as full_name FROM Master")

但它返回了什么?
+---------+---------+
| playerID|full_name|
+---------+---------+
|aardsda01|     null|
|aaronha01|     null|
|aaronto01|     null|
| aasedo01|     null|

任何帮助请。

1个回答

5

只需使用concat函数:

sqlContext.sql("SELECT playerID, concat(nameFirst, nameLast) as full_name FROM Master")

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接