Python中的Dynamodb流

23
我想在Python中从DynamoDB流中读取数据,到目前为止我发现的替代方案有:
  1. 使用DynamoDB流低级库函数(如此处所述):然而,在生产环境中维护应用程序必须维护分片等状态,这个解决方案似乎几乎不可行。

  2. 使用用于读取Kinesis流的KCL库:该库的Python版本似乎无法从DynamoDB流中读取。

有哪些选项可以成功地在Python中处理DynamoDB流?(可能示例的链接将非常有帮助)
附言:我已考虑过使用lambda函数来处理DynamoDB流,但对于此任务,我想在应用程序中读取流,因为它必须与无法通过lambda函数完成的其他组件交互。

1
好奇你最终选择了哪种方案?我目前也面临同样的困境,正在考虑使用KCL在Java中实现我的逻辑。 - Matt Fortier
2
也遇到了这个问题。@Ashish 有更新吗? - Avihoo Mamka
这方面有任何更新吗?我正在考虑使用Lambda触发器路线,并让它调用一个Flask服务器来处理流数据。你对此有什么想法吗? - Peter Tao
@PeterTao 使用lambda和dynamo streams是个好主意,但我建议你只获取数据,并通过sqs发送。 - Rafael Marques
1个回答

1
我建议使用lambda。它的设置非常容易,而且非常健壮(可以轻松管理重试、批处理、停机时间等)。
然后,从lambda调用中,您可以轻松地以方便的方式将数据发送到现有程序(包括但不限于:SNS、SQS、自定义服务器Webhook、将数据发送到您拥有的自定义发布/订阅服务...等)。

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接