9得票5回答
AWS CLI V2中的"AWS firehose put-record"报错:Invalid base64。

我曾经能够像这样无问题地将记录发送到Firehose aws firehose put-record --delivery-stream-name my-stream --record='Data="{\"foor\":\"bar\"}"' 但是自从我将cli更新到版本2后,我遇到了这个...

8得票1回答
在使用AWS Kinesis流、Lambda和Firehose时,有人遇到过数据丢失的情况吗?

我目前正在向AWS Kinesis流发送一系列XML消息,我在不同的项目中使用过这个功能,所以我非常自信这部分工作是可行的。然后我编写了一个Lambda函数来处理从Kinesis流到Kinesis Firehose的事件: import os import boto3 import base...

30得票2回答
在通过AWS Kinesis Firehose插入Elasticsearch文档时,是否有一种手动设置文档ID的方法?

我已设置了一个AWS Kinesis Firehose流以将数据提供给AWS ElasticSearch集群,并且我可以通过将它们发送到Firehose流来成功插入文档,由此将其加载到ElasticSearch中。 但是,当发送文档到Firehose流时,我希望能够手动指定/设置文档的id值...

7得票5回答
将数据放入AWS Firehose的CLI

今天AWS Firehose发布了。我正在尝试使用AWS CLI将数据放入流中,并试图弄清楚如何操作。我有一个简单的JSON有效载荷和相应的Redshift表,该表具有映射到JSON属性的列。我已经尝试了各种组合,但似乎无法通过cli传递JSON有效负载。 我尝试过以下方法: aws fi...

10得票2回答
有没有一种方法可以指定文件扩展名,将文件保存到Kinesis Firehose的S3中?

我正在设置Kinesis Firehose流,文件以分隔符形式在S3上创建,一切正常。但是我想知道是否有一种方法可以指定此文件的扩展名,因为消费者需要它为CSV或TXT格式。有没有办法实现这个需求? 谢谢。

21得票6回答
我可以在将数据交付到S3之前自定义Kinesis Firehose中的分区吗?

我有一个Firehose流,旨在从不同来源和不同事件类型中摄取数百万个事件。该流应将所有数据传递到一个S3存储桶中,作为未经处理的原始数据。 我考虑根据嵌入在事件消息中的元数据,如事件源、事件类型和事件日期,在S3中对这些数据进行分区。 然而,Firehose遵循其默认的基于记录到达时间的分区...

8得票4回答
Kinesis Firehose 中的 Lambda.InvokeAccessDenied

我正在尝试使用Firehose交付流设置Lambda转换。我已为Firehose定义了一个IAM角色,其中包括以下策略文档: { "Statement": { "Action": [ "lambda:InvokeFunction", ...

10得票3回答
AWS Elastic MapReduce和AWS Kinesis Data Analytics之间有什么区别?

我正在使用这些工具执行Flink作业。 我认为只要进行适当的配置,两者都可以完全达到相同的效果。Kinesis数据分析是否有EMR无法做到或反之亦然的功能? Amazon Kinesis数据分析是分析流数据、获取可操作见解并实时响应业务和客户需求的最简单方法。 Amazon Elastic...

33得票13回答
通过Amazon Kinesis Firehose流写入S3的数据如何读取?

我正在将记录写入Kinesis Firehose流,最终由Amazon Kinesis Firehose写入S3文件。我的记录对象看起来像ItemPurchase { String personId, String itemId } 写入 S3 的数据如下:{"personId...

32得票3回答
将AWS Kinesis Firehose中的Parquet格式数据写入AWS S3

我想将以parquet格式的数据从Kinesis Firehose导入S3。到目前为止,我只找到了一个需要创建EMR的解决方案,但我正在寻找更便宜和更快的方式,比如直接从Firehose将接收到的JSON存储为parquet,或者使用Lambda函数。 非常感谢, Javi。