从CSV文件插入Hive表的字符串值需要使用双引号。

3
我往hive表中导入了一个csv文件。 关于这个csv文件:列值用双引号括起来,由逗号分隔。 csv文件的样例记录
"4","good"
"3","not bad"
"1","very worst"

我用以下语句创建了一个Hive表:

create external table currys(review_rating string,review_comment string ) row format fields delimited by ',';

表已创建。

现在,我使用load data local inpath命令成功加载了数据。当我查询表时,
select * from currys;

结果如下:

"4"  "good"
"3"  "not bad"
"1"   "very worst"

替代

4  good
3  not bad
1  very worst

记录使用双引号插入,但不应该这样做。

请告诉我如何去掉这个双引号...非常感谢任何帮助或指导...

提前感谢!


行为是适当的,因为您的分隔符是“,”,并且您没有做任何事情来删除“”“”。 - Suvarna Pattayil
请查看此链接:https://dev59.com/zmYq5IYBdhLWcg3w8lJo。 - Suvarna Pattayil
1个回答

7
你是否在使用任何serde?如果是的话,你可以在SERDE PROPERTIES中编写一个regex命令来删除引号。 或者你可以使用这里csv-serde,并定义quote character

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接