我正在尝试了解AWS Athena服务和新发布的S3 Select(仍在预览中)之间的区别。
这两者的用例有何不同?它们似乎都帮助从S3中选择部分数据。
我正在尝试了解AWS Athena服务和新发布的S3 Select(仍在预览中)之间的区别。
这两者的用例有何不同?它们似乎都帮助从S3中选择部分数据。
看起来我们缺少一个重要的东西:
S3 Select仅对一个对象进行操作,而Athena可以在多个路径上运行查询,这将包括该路径下的所有文件。
您可以将AWS S3 Select视为一种成本效益的存储优化,它允许在S3和冰川中检索与谓词匹配的数据,也称作下推过滤。
AWS Athena是完全托管的分析服务,允许运行任意符合ANSI SQL标准的查询——包括group by、having、window、geo函数、SQL DDL和DML。
亚马逊Athena: 亚马逊 Athena 是一个查询服务,可以通过标准 SQL 对存储在 S3 中的数据进行分析,使用起来非常方便。 Athena 是一种无服务器的服务,无需设置或管理基础架构,只需为查询支付费用。它会自动扩展 - 并行执行查询,这使得即使在处理大型数据集和复杂查询时也能快速生成结果。
使用案例: Athena 可用于处理日志,执行临时分析和运行交互式查询和连接操作。 它可以跨多个路径运行查询,包括该路径下的所有文件。
S3 Select : S3 Select 是 S3 的一个特性,旨在检索对象数据的子集(使用简单的 SQL 表达式),而不是整个大小可达 5TB 的对象。 S3 Select 在 S3 存储桶中一次只能运行单个对象上的查询。
结论 : Athena 可用于对多个文件执行复杂查询,并跨 S3 存储桶下的多个文件夹。 S3 Select 可用于基于单个对象运行简单查询。
Athena是一个以S3为后台支持的商业报告或分析工具(从我所使用的有限情况来看)。
S3 Select似乎使用了相同类型的技术,但我猜它更适用于直接由应用程序使用来过滤或分割其数据集。
目前,在S3 Select处于预览阶段时,使用是免费的,没有明确的定价。但是,您需要在此处申请。
S3 Select在预览期间支持CSV、JSON和Parquet文件,包括有或没有GZIP压缩的文件。在预览期间,不支持加密的对象。
由于S3 Select仍处于预览阶段,AWS没有内部案例来验证该服务的使用情况。但是,我可以找到一篇博客的参考资料,可能会对您有所帮助。
我认为,您可以观看这个Twitch视频,它可以帮助您很多。
SELECT
。Amazon S3 Select仅支持SELECT SQL命令。以下ANSI标准子句适用于SELECT:
- SELECT列表
- FROM子句
- WHERE子句
- LIMIT子句
注意:Amazon S3 Select查询目前不支持子查询或连接。