52得票7回答
如何将Spark SQL中的数据导出为CSV格式

这个命令适用于HiveQL: insert overwrite directory '/data/home.csv' select * from testtable; 但是使用 Spark SQL 时,我遇到了一个错误,其中包含org.apache.spark.sql.hive.Hive...

45得票3回答
在Hive中展开结构体数组

这是下面的Hive表格CREATE EXTERNAL TABLE IF NOT EXISTS SampleTable ( USER_ID BIGINT, NEW_ITEM ARRAY<STRUCT<PRODUCT_ID: BIGINT,TIMESTAMPS:STRING>&g...

35得票3回答
在将CSV加载到Hive表中时跳过第一行

大家好, 我使用以下命令在Hive中创建了一个表 - CREATE TABLE db.test ( fname STRING, lname STRING, age STRING, mob BIGINT ) row for...

35得票18回答
Java.lang.RuntimeException:无法实例化org.apache.hadoop.hive.metastore.HiveMetaStoreClient

我已按照以下链接配置了我的Hive:http://www.youtube.com/watch?v=Dqo1ahdBK_A,但是在Hive中创建表时出现了以下错误。我正在使用hadoop-1.2.1和hive-0.12.0。hive> create table employee(emp_i...

34得票4回答
在Hive中如何计算日期差异

我是一名新手。我有一个员工表,其中一列指定了加入日期,我想检索过去3个月内加入的员工列表。我知道可以使用from_unixtime(unix_timestamp())获取当前日期。如何计算datediff?是否有像MS SQL中的内置DATEDIFF()函数?请给予建议!

33得票3回答
在Spark SQL表中展开(转置?)多个列

我正在使用Spark SQL(我提到它在Spark中,以防对SQL语法有影响 - 我还不太确定),我有一个表格,我试图重新构造它,但我卡在了同时转置多列的步骤。 基本上我的数据看起来像:userId someString varA varB 1 "ex...

33得票3回答
在Hive中选择前2行

我正在尝试根据Hive(版本0.11)中的薪水信息,从员工列表中检索前2个表格。由于它不支持TOP函数,是否有其他替代方案?或者我们需要定义一个UDF吗?

33得票1回答
在HIVE QL中的表中添加一列

我正在使用HIVE编写代码,创建一个由1300行和6列组成的表:create table test1 as SELECT cd_screen_function, SUM(access_count) AS max_count, MIN(response_time_min) a...

33得票3回答
如何在Hive中计算中位数

我有一个Hive表,name age sal A 45 1222 B 50 4555 c 44 8888 D 78 1222 E 12 7888 F 23 ...

33得票4回答
如何重命名Hive表而不改变其位置?

根据以下Hive文档: 重命名表 ALTER TABLE table_name RENAME TO new_table_name; 此语句允许您将一个表的名称更改为不同的名称。 从版本0.6开始,对管理表进行的重命名也会移动其HDFS位置。(旧版本的Hive仅在元存储中重命名表而不移动HDF...