7得票1回答
GCP Dataflow:从Pub/Sub IO流式传输的系统延迟

我们使用“系统延迟”来检查我们的Dataflow作业的健康状况。例如,如果我们看到系统延迟增加,我们会尝试找出如何降低此指标。关于这个度量标准有一些问题。 1)什么是系统延迟的确切含义? 答:数据项等待处理的最长时间。 以上是我们在GCP控制台上点击信息图标时看到的内容。在这种情况下,“...

8得票1回答
数据流处理

我有一类计算需要使用图形结构来描述。这个图形结构非常复杂,有多个输入、分叉节点和需要其他多个节点结果的节点。在所有计算中,还可能存在多个汇点。但是,这个图不会出现任何环路。输入节点会被更新,值会通过(目前纯粹概念性的)图进行传递。节点保留状态,随着输入的变化而变化,计算必须按照输入的顺序进行。...

7得票1回答
如何从 Apache Beam Python 的 PCollection 中创建 N 个元素的组?

我想要实现类似这样的功能:Beam/Dataflow中的批处理PCollection 以上链接中的答案是用Java编写的,而我使用的语言是Python。因此,我需要一些帮助来获得类似的构造。 具体来说,我有这个: p = beam.Pipeline (options = pipeline_...

7得票3回答
如何在Python 3.x上获取用于GCP数据流的Apache Beam

我对GCP和dataflow非常陌生。然而,我想开始测试和部署一些利用GCP上的dataflow的流程。根据文档和所有与dataflow相关的内容,必须使用Apache项目BEAM。因此,按照官方文档这里,支持的Python版本是2.7。 老实说,这令人非常失望,因为Python 2.x版本...

10得票3回答
在增量构建有向图的同时更高效地计算每个依赖项的传递闭包

我需要回答以下问题:在一个依赖图中,给定一个节点,将其依赖项根据它们自己的传递依赖项分组,这些依赖项会受到特定起始节点的影响。 换句话说,给定依赖图中的一个节点,找到一组直接依赖项的集合,它们具有来自该特定起始节点的共同依赖项。 例如,给定伪代码:let a = 1 let b = 2 l...

19得票10回答
实现神经网络的最佳编程语言是什么?

我不需要一个神经网络库,因为我正在创建新类型的网络。为此,我需要一种好的“数据流”语言。 当然,你可以用C、C++、Java等语言来实现,但从头开始处理多线程等问题会很麻烦。 另一方面,像Oz或Erlang这样的语言似乎更适合,但它们没有很多库,并且难以掌握(玩弄它们很容易,但创建完整的软...

16得票11回答
数据流编程 - 模式和框架

我刚接触到提议中的Boost::Dataflow库。这似乎是一种有趣的方法,我想知道是否还有其他类似的C++框架,以及是否有任何相关的设计模式。 我并没有排除Boost::Dataflow,只是正在寻找任何可用的替代方案,以便更好地了解领域和我的选项(或者如有必要,开发自己的)。

9得票1回答
Dataflow / Apache Beam 在哪个阶段确认 pub/sub 消息?

我有一个使用Pub/Sub订阅作为无界源的数据流处理工作。我想知道在哪个阶段数据流处理会确认收到Pub/Sub消息。如果在数据流处理管道的任何阶段抛出异常,似乎消息就会丢失。 此外,我想知道如何编写最佳实践的数据流处理管道,以便在失败时从Pub/Sub无界源中检索消息。谢谢!

19得票10回答
这种语言特性已经存在了吗?

我目前正在开发一种用于连续环境(类比于电气工程)编程的新语言,并且我对某些语言构建有一些想法。 让我通过解释和定义来说明这个特性: x = a U b; 这里的x是一个变量,a和b是其他变量(或静态值)。这就像a和b之间的并集一样;没有重复项,也没有特定的顺序。 with(x) { ...

17得票1回答
明显的BufferBlock.Post/Receive/ReceiveAsync竞争/错误

此帖已发布到http://social.msdn.microsoft.com/Forums/en-US/tpldataflow/thread/89b3f71d-3777-4fad-9c11-50d8dc81a4a9 我知道...我没有充分利用TplDataflow的潜力。目前,我只是使用Bu...