我正在尝试像这样将CSV文件加载到Hive表中:
CREATE TABLE mytable
(
num1 INT,
text1 STRING,
num2 INT,
text2 STRING
)
ROW FORMAT DELIMITED FIELDS TERMINATED BY ",";
LOAD DATA LOCAL INPATH '/data.csv'
OVERWRITE INTO TABLE mytable;
csv文件使用逗号(,)作为分隔符,格式如下:
1, "some text, with comma in it", 123, "more text"
由于第一个字符串中有“,”,因此这将返回损坏的数据。是否有一种方法可以设置文本分隔符或使Hive忽略字符串中的“,”?
我无法更改CSV的分隔符,因为它是从外部来源获取的。