得票数最多 'multi-gpu' 问题

关联标签

165得票5回答

我正在开发一个用 Java 完成的商业项目，需要大量计算能力来计算商业市场。虽然数学很简单，但数据量很大。我们订购了一些 CUDA GPU 来尝试使用，但由于 CUDA 不支持 Java，我不知道该从哪里开始。我应该构建 JNI 接口吗？还是应该使用 JCUDA，或者有其他方法？在这个...

24得票1回答

我如何使用两个设备以改善以下代码（向量求和）的性能？是否可能同时使用更多设备？如果是，如何管理不同设备上全局内存中向量的分配？#include <stdio.h> #include <stdlib.h> #include <math.h> #include ...

22得票3回答

在Vulkan中使用多个GPU，是否类似于创建多个命令队列，然后在它们之间分配命令缓冲区？存在两个问题：在OpenGL中，我们使用GLEW获取函数。在有多个GPU的情况下，每个GPU都有自己的驱动程序。我们该如何在Vulkan中处理？部分帧是否由一个GPU生成，并且其他GPU（例如...

19得票1回答

问题我有一个OpenGL应用程序，将在具有不同多GPU配置（可能是从XP到7的不同Windows版本）的机器上运行。是否有一种通用方法可以选择特定的GPU作为OpenGL渲染器，而与GPU组合无关（例如NVIDIA + NVIDIA，NVIDIA + AMD，NVIDIA + Intel等...

12得票1回答

在PC上创建OpenGL上下文时，是否有办法选择使用哪个物理设备或多少个设备？最新的OpenGL（4.5）API是否支持多GPU架构？如果我有两张相同的显卡（例如，两张Nvidia GeForce显卡），如何正确地编写OpenGL API以从具有两张显卡的事实中获得好处？如何将OpenG...

12得票5回答

在Mac OS X中，每个显示器都被分配了一个唯一的CGDirectDisplayID号码。您可以使用CGGetActiveDisplayList()或[NSScreen screens]等方法来访问它们。根据苹果文档：显示器ID可以跨进程和系统重启保持不变，并且通常仅在某些显示器参...

12得票3回答

我想知道在使用多个GPU进行训练时，实现批量归一化层并同步批量统计的可能方法。 Caffe 或许有一些可以实现的caffe变体，比如这里。但对于BN层，我的理解是它仍然只同步层的输出，而不是均值和方差。也许MPI可以同步均值和方差，但我认为MPI有点难以实现。 Torch 我看到一些评论这...

11得票5回答

我有一个标准的tensorflow Estimator和一些模型，希望在多个GPU上运行它而不是只在一个GPU上。如何使用数据并行性实现此目标？我搜索了Tensorflow文档，但没有找到示例；只有一些句子说使用Estimator很容易实现。是否有人有使用tf.learn.Estima...

11得票2回答

首先，我还是tensorflow的新手。我正在使用v0.9，并尝试使用我们机器上安装的两个GPU。这里发生了以下情况：当我在该机器上启动一个 training data 脚本时，它只在其中一个GPU上运行。默认情况下它会占用第一个GPU gpu:0/。当我启动另一个 training ...

11得票3回答

我希望我的模型可以在多个GPU上运行，共享参数但使用不同的数据批次。我能否使用model.fit()实现这样的功能？还有其他替代方案吗？