如何在spark-sql中显示列标题

3

我正在Hortonworks HDP 2.6.4 Sandbox环境下运行spark-sql。我在spark-sql中创建了两个非常基本的表,一个是客户表,另一个是订单表。我编写了一个JOIN语句来收集订单信息,如下:

SELECT Customers.ID, Name, Product_Name
FROM Customers JOIN Orders
WHERE Customers.ID = Orders.Customer_ID;

然而,与pyspark中的SQL代码不同,列名默认显示。但是,在spark-sql中,默认情况下没有显示任何列名。以下是我的结果(数据库中有5个客户和5个订单):

2222    Emily   HTC Edge
1111    John    Google Nexus 5
1111    John    Samsung Galaxy 7
1111    John    iphone 6
4444    Jane    Samsung J Series
Time taken: 0.516 seconds, Fetched 5 row(s)
spark-sql>

有人知道如何打开列标题名称吗?我想在结果集的第一行看到ID、名称和产品名称。


1
你使用什么命令来显示结果?df.show()会在输出中显示列名。 - Rony
他正在使用spark-sql,而不是spark-shell。所以没有.show(),默认情况下也不显示表头。 - angelcervera
这个回答解决了你的问题吗?在使用spark-sql进行查询时显示列名 - Leonid Vasilev
1个回答

0
你应该启动Spark SQL cli,并使用配置参数spark.hadoop.hive.cli.print.header来启用它。
例如。
spark-sql --conf "spark.hadoop.hive.cli.print.header=true"

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接