11得票3回答
Flink集群配置问题-没有可用的插槽

我已经部署了配置为以下并行度的Flink集群:jobmanager.heap.mb: 2048 taskmanager.heap.mb: 2048 taskmanager.numberOfTaskSlots: 5 parallelism.default: 2 但是,如果我尝试运行任何示例或ja...

11得票2回答
Apache Flink: 使用filter()还是split()来拆分流?

我从Kafka获得了一个DataStream,其中MyModel的一个字段有两种可能的值。MyModel是一个POJO对象,它包含从Kafka消息中解析出来的领域特定的字段。 DataStream<MyModel> stream = env.addSource(myKafkaCo...

10得票1回答
Flink流式处理中事件时间窗口排序

我遇到一些困惑,不太理解事件时间窗口的语义。以下程序生成了一些具有时间戳的元组,这些时间戳被用作事件时间,并进行简单的窗口聚合。我期望输出与输入顺序相同,但实际上输出的顺序不同。为什么输出与事件时间的顺序不一致? import java.util.concurrent.TimeUnit im...

10得票1回答
在Apache Spark和Apache Flink中,“streaming”是什么意思?

当我访问Apache Spark Streaming网站时,看到了这样一句话: Spark Streaming使得构建可扩展的容错流应用程序变得简单。 而在Apache Flink网站上,有这样一句话: Apache Flink是一个可扩展的批处理和流数据处理开源平台。 什么是...

10得票3回答
AWS Elastic MapReduce和AWS Kinesis Data Analytics之间有什么区别?

我正在使用这些工具执行Flink作业。 我认为只要进行适当的配置,两者都可以完全达到相同的效果。Kinesis数据分析是否有EMR无法做到或反之亦然的功能? Amazon Kinesis数据分析是分析流数据、获取可操作见解并实时响应业务和客户需求的最简单方法。 Amazon Elastic...

10得票1回答
Apache Flink:如何应用多个计数窗口函数?

我有一串带有键的数据,需要计算不同时间段(1分钟、5分钟、1天、1周)内的滚动计数。 是否可以在单个应用程序中计算所有四个窗口计数?

10得票3回答
如何在kafka 0.9.0中使用多线程消费者?

kafka文档提供了一种方法,如下所述: 每个线程一个消费者:一个简单的选择是为每个线程分配一个独立的消费者实例。 我的代码:public class KafkaConsumerRunner implements Runnable { private final Atom...

10得票2回答
使用Apache Flink时如何使用Collections$UnmodifiableCollection?

使用下面的代码与 Apache Flink 一起使用:DataStream<List<String>> result = source.window(Time.of(1, TimeUnit.SECONDS)).mapWindow(new WindowMapFunctio...

10得票1回答
如何构建和使用flink-connector-kinesis?

我正在尝试将Apache Flink与AWS Kinesis一起使用。 文档说我必须自己构建连接器。 因此,我构建了连接器,并为我的项目添加了jar文件,同时在pom.xml文件中添加了依赖项。<dependency> <groupId>org.apache....

10得票2回答
Flink Kafka EXACTLY_ONCE导致KafkaException:ByteArraySerializer不是Serializer的实例

所以,我试图在我的Flink Kafka流处理作业中启用EXACTLY_ONCE语义,同时进行检查点。 然而,我无法让它工作,所以我尝试从Github下载测试示例代码: https://github.com/apache/flink/blob/c025407e8a11dff344b58732...