我使用 AWS Glue 爬取数据,从包含数据的 S3 文件夹中导入 JSON 数据。这些数据的根大括号是像这样的数组形式:
这最终会导致生成以下这样的模式:
我收到以下错误信息:
也许可以通过设置Glue爬虫,仅添加数组中的元素而避免嵌套?
[{id: '1', name: 'rick'},{id: '2', name: 'morty'}]
这最终会导致生成以下这样的模式:
array<struct<expand:string,id:string,name:string>>
我该如何在 Athena 中通过 name
进行查询?
如果我尝试这样做:
SELECT * FROM people_s3_buckets WHERE name = "rick";
我收到以下错误信息:
SYNTAX_ERROR: Column 'name' cannot be resolved
也许可以通过设置Glue爬虫,仅添加数组中的元素而避免嵌套?