165得票5回答
使用Java与Nvidia GPU(CUDA)

我正在开发一个用 Java 完成的商业项目,需要大量计算能力来计算商业市场。虽然数学很简单,但数据量很大。 我们订购了一些 CUDA GPU 来尝试使用,但由于 CUDA 不支持 Java,我不知道该从哪里开始。我应该构建 JNI 接口吗?还是应该使用 JCUDA,或者有其他方法? 在这个...

24得票1回答
多GPU的基本用法

我如何使用两个设备以改善以下代码(向量求和)的性能?是否可能同时使用更多设备?如果是,如何管理不同设备上全局内存中向量的分配?#include <stdio.h> #include <stdlib.h> #include <math.h> #include ...

22得票3回答
如何在Vulkan中实现多GPU编程?

在Vulkan中使用多个GPU,是否类似于创建多个命令队列,然后在它们之间分配命令缓冲区? 存在两个问题: 在OpenGL中,我们使用GLEW获取函数。在有多个GPU的情况下,每个GPU都有自己的驱动程序。我们该如何在Vulkan中处理? 部分帧是否由一个GPU生成,并且其他GPU(例如...

19得票1回答
在多GPU环境下,有没有一种编程方式可以选择渲染GPU?(Windows)

问题 我有一个OpenGL应用程序,将在具有不同多GPU配置(可能是从XP到7的不同Windows版本)的机器上运行。是否有一种通用方法可以选择特定的GPU作为OpenGL渲染器,而与GPU组合无关(例如NVIDIA + NVIDIA,NVIDIA + AMD,NVIDIA + Intel等...

12得票1回答
OpenGL 多GPU支持

在PC上创建OpenGL上下文时,是否有办法选择使用哪个物理设备或多少个设备? 最新的OpenGL(4.5)API是否支持多GPU架构? 如果我有两张相同的显卡(例如,两张Nvidia GeForce显卡),如何正确地编写OpenGL API以从具有两张显卡的事实中获得好处? 如何将OpenG...

12得票5回答
如何在Core Foundation/IO Kit中解决新型多GPU苹果笔记本电脑上CGDirectDisplayID更改的问题?

在Mac OS X中,每个显示器都被分配了一个唯一的CGDirectDisplayID号码。您可以使用CGGetActiveDisplayList()或[NSScreen screens]等方法来访问它们。根据苹果文档: 显示器ID可以跨进程和系统重启保持不变,并且通常仅在某些显示器参...

12得票3回答
使用同步均值和方差的多GPU BN层实现方法

我想知道在使用多个GPU进行训练时,实现批量归一化层并同步批量统计的可能方法。 Caffe 或许有一些可以实现的caffe变体,比如这里。但对于BN层,我的理解是它仍然只同步层的输出,而不是均值和方差。也许MPI可以同步均值和方差,但我认为MPI有点难以实现。 Torch 我看到一些评论这...

11得票5回答
如何使用数据并行ism在多个GPU上运行Tensorflow Estimator

我有一个标准的tensorflow Estimator和一些模型,希望在多个GPU上运行它而不是只在一个GPU上。如何使用数据并行性实现此目标? 我搜索了Tensorflow文档,但没有找到示例;只有一些句子说使用Estimator很容易实现。 是否有人有使用tf.learn.Estima...

11得票2回答
TensorFlow同时使用两个GPU

首先,我还是tensorflow的新手。我正在使用v0.9,并尝试使用我们机器上安装的两个GPU。这里发生了以下情况: 当我在该机器上启动一个 training data 脚本时,它只在其中一个GPU上运行。默认情况下它会占用第一个GPU gpu:0/。 当我启动另一个 training ...

11得票3回答
如何使用Keras进行多GPU训练?

我希望我的模型可以在多个GPU上运行,共享参数但使用不同的数据批次。 我能否使用model.fit()实现这样的功能?还有其他替代方案吗?