每次用户与我的应用程序交互时,我都想要进行报告。那么我应该在何时将文件写入S3?应该写多少个文件? 我的意思是: - 如果不立即发送信息,则可能会因为连接中断或收集并准备好发送到S3时系统中出现某些错误而失去它。 - 如果我在每个用户交互时都将文件写入S3,我最终将拥有数百个文件(每个文件的数据很少),需要管理、排序、复制到RedShift后删除...这似乎不是一个好的解决方案。
我错过了什么?我应该改用DynamoDB吗?我应该使用简单的向Redshift插入语句!? 如果确实需要将数据写入DynamoDB,那么应该在复制后删除保留表格..哪些是最佳实践?
无论哪种情况,如何避免在RedShift中发生数据重复?感谢您的帮助!