15得票3回答
Hive如何选择除了一个列以外的所有列?

假设我的表格看起来像这样:Col1 Col2 Col3.....Col20 Col21 现在我想选择除Col21之外的所有内容。 我想在将其插入其他表之前更改为unix_timestamp()。 因此,简单的方法是执行以下操作:INSERT INTO newtable partition(Co...

14得票2回答
`load data inpath` 和 `location` 在Hive中有什么区别?

在我们公司中,我经常看到这两个命令被使用,而且我想了解它们之间的区别,因为它们的功能对我来说似乎是相同的: 1create table <mytable> (name string, number double); load data inpath '/directory-p...

14得票2回答
HIVE - INSERT OVERWRITE与DROP TABLE + CREATE TABLE + INSERT INTO的区别

我正在编写一些Hive自动脚本,发现我们需要定期清除表中的数据并插入新数据。我们在思考什么方法可以更快?INSERT OVERWRITE TABLE SOME_TABLE SELECT * FROM OTHER_TABLE; 或者可以像这样更快地完成:DROP TABLE SOME_T...

14得票3回答
Hive表达式不在分组键中

我在HIVE中创建了一个表。 它有以下列:id bigint, rank bigint, date string 我想要获取每月的平均排名。我可以使用这个命令。它有效。select a.lens_id, avg(a.rank) from tableA a group by a.lens_id,...

14得票3回答
Hive JOIN中遇到左右别名,没有任何不等式子句

我正在使用以下查询:Select S.MDSE_ITEM_I, S.CO_LOC_I, MAX(S.SLS_D) as MAX_SLS_D, MIN(S.SLS_D) as MIN_SLS_D, sum(S.SLS_UNIT_Q) as SLS_UNIT_Q, ...

14得票3回答
使用Hive查找分组中的第一行

对于以下格式的学生数据库:Roll Number | School Name | Name | Age | Gender | Class | Subject | Marks 如何找出每个班级的最高分?下面的查询返回整个组,但我只对找到组中第一行感兴趣。 SELECT * FROM score...

14得票2回答
在Hive中,“Stored as InputFormat, OutputFormat”和“Stored as”的区别是什么?

如果表格是ORC,在执行show create table然后执行结果中的create table语句时会出现问题。 使用show create table,您会得到以下内容:STORED AS INPUTFORMAT ‘org.apache.hadoop.hive.ql.io.orc....

14得票10回答
在HIVE中比较两个表的相等性

我有两个表,table1和table2。它们拥有相同的列:key, c1, c2, c3 我想检查这些表是否相等(它们拥有相同的行)。目前我有这两个查询(在HIVE中,<>表示不相等):select count(*) from table1 t1 left outer join ...

13得票2回答
HiveQL - 如何使用任何UDF查找列值是否为数字?

基本上,我想根据一个列的值返回行。 如果该列包含非数字值,则从Hive表中返回这些行。 在Hive中是否有任何UDF可用?

13得票3回答
Hive: 更干净的SELECT AS和GROUP BY写法

我尝试编写如下的Hive SQL语句SELECT count(1), substr(date, 1, 4) as year FROM *** GROUP BY year 但是Hive无法识别别名为“year”的名称,它抱怨说: FAILED:SemanticException [Error 1...