我已经尝试了亚马逊为EMR实例提供的JSON SerDe,如果您需要将JSON字典字段映射到列,则效果非常好。但是我无法弄清如何对JSON数组执行相同操作。例如,如果有以下JSON数组:
[23123.32, "Text Text", { "key1": "value1" } ]
是否有一种方法将数组的第一个元素映射到Hive表中的列?嵌入式字典字段呢?
[23123.32, "Text Text", { "key1": "value1" } ]
是否有一种方法将数组的第一个元素映射到Hive表中的列?嵌入式字典字段呢?
在我找到这个在Github上的serde之前,我一直在苦苦挣扎着相同的问题 - https://github.com/rcongiu/Hive-JSON-Serde 只需在开始Hive时使用“add jar”命令将其包含进去,它就能像魔法般工作。