得票数最多 'amazon-athena' 问题 - 第6页

标签列表

关联标签

14得票4回答

如何使用Python中的Lambda函数，在连接到S3的AWS Athena中进行查询？

我已将我的.csv文件保存在S3桶中。我可以使用AWS Athena查询S3的数据。我们是否可以连接Lambda函数到Athena，并从Lambda函数查询数据？请帮忙解决。谢谢。

pythonamazon-web-servicesamazon-s3boto3amazon-athena

14得票2回答

AWS Athena - GENERIC_INTERNAL_ERROR: 分区值的数量与过滤器不匹配

我在 Athena 查询一张表时遇到错误: GENERIC_INTERNAL_ERROR: Number of partition values does not match number of filters。之前我能够查询成功，但是为了优化后续查询中的连接操作，我添加了另一个分区(AW...

amazon-web-servicesaws-glueprestoamazon-athena

14得票1回答

在AWS Athena中将多个元素存储在JSON文件中

我有一些JSON文件存储在S3存储桶中，每个文件都有多个相同结构的元素。例如，[{"eventId":"1","eventName":"INSERT","eventVersion":"1.0","eventSource":"aws:dynamodb","awsRegion":"us-west-...

sqljsonamazon-web-servicesamazon-athena

14得票3回答

如何从Amazon Athena查询Parquet数据？

Athena使用S3表中的字段创建一个临时表。我已经使用JSON数据完成了这个过程。你能帮我学习如何使用parquet数据创建表格吗？我尝试了以下步骤：将样本JSON数据转换为parquet数据。上传parquet数据到S3。使用JSON数据的列创建了一个临时表。这样做后，...

amazon-web-servicesparquetamazon-athena

13得票4回答

Azure等价于AWS Athena在s3上的服务

我有一个在AWS上的工作负载，将csv文件存储在s3中的分区中，然后使用Athena进行SQL查询，并将结果写回到s3。我正在寻找在Azure中具有相等行为的方法，在那里我可以将csv文件存储在存储中并对它们进行查询，并将结果写回到该存储中。

amazon-s3azure-storageazure-blob-storageamazon-athena

13得票2回答

Athena无法使用OpenCSVSerde解析日期

我在S3上有一个非常简单的csv文件"i","d","f","s" "1","2018-01-01","1.001","something great!" "2","2018-01-02","2.002","something terrible!" "3","2018-01-03","3.00...

csvhiveopencsvamazon-athenapresto

13得票2回答

Athena在msck修复表后没有添加分区

我有一个Firehose，它将数据存储在S3中的默认目录结构下：YY/MM/DD/HH，并在Athena中创建了一个表，这些列被定义为分区：年份：字符串、月份：字符串、日期：字符串、小时：字符串运行后：msck repair table clicks 我只收到：Partitions not...

hiveamazon-athena

13得票1回答

AWS Athena分区提取所有路径

最近，我在使用AWS Athena时遇到了一个问题，当分区数量非常高时。旧版只有一个数据库和表，只有1个分区级别，比如id=x。例如，我们有一张表，用于存储每个ID（产品）的支付参数，ID并不是很多，假设只有1000-5000个。现在，如果在where子句中传递id号进行查询，比如“......

amazon-web-servicesnosqlaws-glueprestoamazon-athena

13得票9回答

AWS Glue爬虫无法提取CSV标题行

我在这里快要走投无路了...我有15个CSV文件，它们是从一个类似于beeline查询的过程中生成的：beeline -u CONN_STR --outputformat=dsv -e "SELECT ... " > data.csv 我选择了 dsv，因为某些字符串...

csvamazon-athenaaws-glue

13得票6回答

Pandas 数据框的 datetime64[ns] 类型在 Hive/Athena 中无法使用。

我正在开发一个Python应用程序，它可以将CSV文件转换为Hive / Athena兼容的Parquet格式，并使用fastparquet和pandas库执行此操作。 CSV文件中有时间戳值，例如2018-12-21 23:45:00，需要在Parquet文件中写入timestamp类型。以...

pythonpandashiveamazon-athenafastparquet