125得票19回答
Hive内部表和外部表有什么区别?

有谁可以告诉我Hive的外部表和内部表之间的区别。我知道这个区别在删除表时会体现出来。但是我不理解为什么在内部表中数据和元数据都被删除,而在外部表中只有元数据被删除。有人能用节点的术语来解释一下吗?

115得票10回答
如何在HIVE脚本中设置变量

我正在寻找Hive QL中与SET varname = value相对应的SQL语句。 我知道我可以像这样做:SET CURRENT_DATE = '2012-09-16'; SELECT * FROM foo WHERE day >= @CURRENT_DATE 但是我得到了这个错误...

112得票4回答
如何获取/生成现有Hive表的创建语句?

假设您在Hive中已经有了“table”,是否有快捷的方式(类似于其他数据库)可以获取该表的“CREATE”语句?

89得票6回答
如何更新/删除Hive分区?

在将分区添加到 Hive 的 外部表 后,我该如何更新/删除它?

85得票18回答
如何将HiveQL查询结果输出为CSV格式?

我们想将Hive查询结果放入CSV文件中。 我认为命令应该像这样: 我们希望将Hive查询结果导出为CSV文件。我认为命令应该是这样的: INSERT OVERWRITE LOCAL DIRECTORY '/path/to/directory' ROW FORMAT DELIMITED F...

80得票6回答
如何在Hive SQL中选择当前日期

如何在Hive中获取当前系统日期?在MySQL中,我们可以使用select now()命令,是否有人能够帮助我获取查询结果。我对Hive非常陌生,是否有适当的Hive文档可以提供关于伪列和内置函数的详细信息。 SELECT from_unixtime(unix_timestamp()); H...

78得票10回答
我已经在Hive中创建了一个表,我想知道我的表创建在哪个目录下?

我在Hive中创建了一个表,想知道它创建在哪个目录?我需要知道这个路径...

74得票16回答
Hive插入查询类似于SQL。

我是Hive的新手,想知道是否有办法像在SQL中那样向Hive表中插入数据。我想像下面这样将我的数据插入到Hive中:INSERT INTO tablename VALUES (value1,value2..) 我读到过可以将数据从文件加载到Hive表中,或者可以将数据从一个表导入到Hive表...

67得票3回答
PySpark:使用两个条件和三种结果的withColumn()函数

我正在使用Spark和PySpark。我试图实现与以下伪代码等效的结果:df = df.withColumn('new_column', IF fruit1 == fruit2 THEN 1, ELSE 0. IF fruit1 IS NULL OR fruit2 IS NULL 3...

57得票3回答
Hive:将字符串转换为整数

我正在寻找一种内置的UDF,用于将我的Hive表中字符串列的值转换为整数,以便在使用SELECT和ORDER BY进行排序时使用。我在语言手册中搜索了一下,但没有用。欢迎提出任何其他建议。