Python 和 Java 在使用 Apache Beam 框架时有何区别?

3

在编写Apache Beam管道时,我使用了Python。我注意到它存在一些限制,例如处理延迟数据等。我想知道与Java相比,是否存在其他限制或优势。

1个回答

6
截至2019年秋季,我们可以认为Python SDK提供了Java SDK的一部分功能。
您可以使用较少的I/O转换(与其他系统、数据存储、消息队列等集成的可能性)。文档在此处提供了Java和Python支持的列表:https://beam.apache.org/documentation/io/built-in/ 您还可以使用较少的聚合转换(例如,Python端缺少Min和Max),尽管随着人们向社区做出贡献,情况正在改善(请参见https://issues.apache.org/jira/browse/BEAM-6695)。
根据我的个人经验,缺乏SQL数据库连接是我选择用Java编写流水线的决定性因素,实际上是Kotlin。

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接