我将从一个JSON文件中读取一些数据,并将其转换为字符串,然后用该字符串发送数据到Hive。
数据在Hive中到达得很好,但它被分配到了错误的列中,我举了一个小例子。
在Hive中:
Table name = TestTable, Column1 = test1, Column2 = test2`
我的代码:
data = hiveContext.sql("select \"hej\" as test1, \"med\" as test2")
data.write.mode("append").saveAsTable("TestTable")
data = hiveContext.sql("select \"hej\" as test2, \"med\" as test1")
data.write.mode("append").saveAsTable("TestTable")
这导致
"hej"
两次出现在test1
中,"med"
两次出现在test2
中,而不是每个都显示一次。似乎总是按照书写顺序显示,而不是按照使用'as'
关键字指定的列进行排序。有任何想法吗?