我有一个日志文件,其中包含时间戳列。时间戳使用Unix纪元时间格式。
我想基于时间戳创建分区,分为年、月和日三个部分。
到目前为止,我已经尝试了这个方法,但它出现了错误。
PARSE ERROR cannot recognize input '(' in column type
这是我的代码。
from (
from raw_data
MAP ${PREFIX}raw_data.line
USING 's3://scripts/clean.py'
AS (timestamp STRING, name STRING)
) map_out
INSERT OVERWRITE TABLE date_base_data_temp PARTITION(year(timestamp), month(timestamp)), day(timestamp)))
select map_out.name;
timestamp_value
(这里是unix_timestamp
)以秒为单位,否则请使用from_unixtime(timestamp_value DIV 1000)
。 - shriyogfrom_unixtime(timestamp_value DIV 1000)
。 - shriyog