在Hive DDL JSON Serde中,"WITH SERDEPROPERTIES ('paths' = 'key1, key2, key3')"实际上是做什么的?

17
非常感谢如果有人能提供这个条款的参考文献。我已经在网上搜索了一段时间,但没有什么进展。

什么是“Python Serde”?你能添加一个相关的链接吗? - David דודו Markovitz
抱歉打错了,应为 json 序列化/反序列化。 - Da Qi
1
看起来"path"是无用的。在这里查看链接-> https://dev59.com/d6Hia4cB1Zd3GeqPbfT9 - Corey Cotton
Hive 没有使用它。Glue 似乎生成了它,但我不确定 Glue 如何使用它。 - Neil McGuigan
2个回答

3

这段代码什么也没做。在 serde 的代码中没有读取 path 属性的内容,据我观察似乎从最早的 Hive 示例就开始流传了这份文档。


我知道当你尝试使用SparkSQL查询Hive表时,HiveWarehouseConnector会使用它。 - MBillau
1
这里的上下文是Amazon Athena,它什么也不做。它是一个serde属性,与该属性相关的serde代码中没有任何引用。 - Theo

2
我联系了亚马逊并说:
有一些文档说:使用serdeproperties('paths'= 'requestBeginTime,adId,impressionId,referrer,userAgent,userCookie,ip'),这个stackoverflow链接: What does "WITH SERDEPROPERTIES ( 'paths' = 'key1, key2, key3') " really do in Hive DDL json serde? 似乎表明它不是必需的。您能删除它或解释一下吗?
他们回复说:
感谢您的反馈。我确认示例文档中不需要WITH SERDEPROPERTIES行。我们将删除该行。再次感谢您帮助改进Athena文档。

截至今天早上,它已经消失了。 - markthegrea

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接