我正在尝试评估使用Kinesis处理日志文件的流程。有一个独立的进程将新日志上传到S3存储桶中,我不能干预该进程。我想知道是否有一种很好的方法可以将出现在S3日志存储桶中的新文件实时流式传输到Kinesis流进行处理。到目前为止,我找到的所有文档都是关于如何将S3用作流的输出。
我的当前解决方案是拥有一台不停轮询S3以获取新文件的机器,然后将新文件下载到本地机器并使用Log4j附加程序将其流式传输。这似乎效率低下。有更好的方法吗?
我正在尝试评估使用Kinesis处理日志文件的流程。有一个独立的进程将新日志上传到S3存储桶中,我不能干预该进程。我想知道是否有一种很好的方法可以将出现在S3日志存储桶中的新文件实时流式传输到Kinesis流进行处理。到目前为止,我找到的所有文档都是关于如何将S3用作流的输出。
我的当前解决方案是拥有一台不停轮询S3以获取新文件的机器,然后将新文件下载到本地机器并使用Log4j附加程序将其流式传输。这似乎效率低下。有更好的方法吗?