11得票4回答
如何计算DAG中的最大并行度?

给定一个DAG(有向无环图),如何计算最大并行性? 瞬时并行性是在算法执行的每个点上可以保持忙碌的处理器数量的最大值;最大并行性是最高瞬时并行性。 换句话说,给定表示任务依赖关系图的DAG,有多少个处理器/线程是最小的,以使得没有任务被阻塞? 我找到的最接近的方法here是: - 在D...

9得票1回答
在Airflow上存储登录凭据的最佳方法是什么?

我发现有很多方法可以将其存储为变量、钩子和其他使用加密的方式。我想知道最好的方法是什么。

7得票1回答
Spark RDD图、血统图和Spark任务DAG是什么?它们之间有什么关系?

当我们谈论RDD图时,它是指血统图还是DAG(有向无环图)或两者兼备?血统图何时生成?它是在Spark任务的DAG之前生成的吗?

7得票5回答
在airflow DAG中出现错误:不支持操作数'list'和'list'的>>。任务的顺序执行和并行执行。

我对Apache Airflow和DAG还不熟悉。DAG中一共有6个任务(task1, task2, task3, task4, task5, task6)。但在运行DAG时,我们遇到了以下错误: DAG unsupported operand type(s) for >>: '...

8得票4回答
Airflow:每个文件运行DAG的正确方式

我有以下任务需要解决: 通过端点以不规则的时间发送文件并进行本地存储。我需要为每个文件触发一个DAG运行。对于每个文件,将执行相同的任务。 总体上,流程如下:对于每个文件,运行任务A->B->C->D 文件会批量处理。虽然这项任务对我来说似乎很简单,但我找到了几种方法来完成它,我对哪一种...

7得票2回答
PHP中如何实现一个高效的DAG?

有没有现成的PHP实现可以用于有向无环图?我找到了Drupal的实现 (https://api.drupal.org/api/drupal/core%21lib%21Drupal%21Component%21Graph%21Graph.php/8),但它并不是很有帮助(我还想添加/删除节点)。...

10得票2回答
如何在虚拟环境中使用Apache Airflow?

我对使用Apache Airflow相当陌生。我使用PyCharm作为我的IDE,创建了一个项目(Anaconda环境),并创建了包含DAG定义和Bash操作器的Python脚本。当我打开Airflow Web服务器时,我的DAGS未显示,只显示默认示例DAGS。我的AIRFLOW_HOME变...

9得票2回答
大规模图中拓扑排序的示例

我希望能找到一些真实世界的大型数据集(>=1M),需要进行拓扑排序。也许与生物信息学相关的内容?

8得票3回答
C++中的稀疏图实现及性能表现

我目前正在使用C ++编写有向图数据结构(此项目中不使用Boost GL)。主要应用将是识别连接组件和汇点。预计图形稀疏(E〜4V上限的边数),并且所有图形的权重都将是均匀的。我正尝试在邻接表、关联表之间进行选择,或者可能是一些我还没听说过的其他表示方法(邻接矩阵由于稀疏性不是选项)。瓶颈可能...

7得票2回答
任务有向无环图的并行执行

我有一个任务列表[任务-A, 任务-B, 任务-C, 任务-D, ...]。 其中一个任务可以有其他任务作为可选依赖关系。 例如: A任务可能依赖于3个任务:B,C和D B任务可能依赖于2个任务:C和E 它基本上是一个有向无环图,执行任务应该只发生在依赖任务执行之后。 现在可能会发生这样...