41得票2回答
在Vulkan中,队列族(Queue family)实际上是什么?

我目前正在学习Vulkan,现在我只是将每个命令拆开并检查结构体,试图理解它们的含义。 目前我正在分析队列族(QueueFamilies),以下是我的代码: vector<vk::QueueFamilyProperties> queue_families = device.ge...

38得票5回答
为CUDA内核调用设置Visual Studio Intellisense

我刚开始学习CUDA编程,进展顺利,我的GPU已被识别。我使用这篇非常有帮助的指南在Visual Studio中部分设置了Intellisense: http://www.ademiller.com/blogs/tech/2010/10/visual-studio-2010-adding-i...

38得票4回答
无法打开某些GPU库。 跳过注册GPU设备。

Tensorflow只使用CPU,而不使用GPU。我猜是因为它期望Cuda 10.0,但找到了10.2。 我曾经安装了10.2版本,但已将其删除并安装了10.0版本。 我运行的是Ubuntu 19.10,AMD Ryzen 2700 Cpu,RTX 2080 S。 我安装了440 Nvidia...

37得票6回答
如何使用GPU进行数学计算。

我希望利用GPU来完成一些方程式的计算,但不知道如何从C#中访问它。我知道XNA和DirectX框架允许使用着色器来访问GPU,但如果没有这些框架,该怎么访问呢?

37得票5回答
Cuda 12 + tf-nightly 2.12:在您的计算机上找不到cuda驱动程序,因此GPU将无法使用,尽管每个检查都正常,在torch中它可以工作。

tf-nightly版本 = 2.12.0-dev2023203 Python版本 = 3.10.6 CUDA驱动程序版本 = 525.85.12 CUDA版本 = 12.0 Cudnn版本 = 8.5.0 我正在使用Linux(x86_64,Ubuntu 22.04) 我在venv虚拟环境...

35得票1回答
WKWebView在acceleratedAnimationDidStart中崩溃

我的客户端应用程序出现了故障,除了在WTFCrash处,我没有从堆栈跟踪中得到太多有用的信息。 我正在使用一个WKWebView实例来显示一个具有基于CSS的动画和视频的网页。该问题发生在iOS 8和9上的各种设备上(从iPhone 5c到6s以及类似范围的iPad)。 WKWebView...

35得票4回答
在CUDA __global__函数中使用printf

我目前正在GPU上编写矩阵乘法代码,并希望调试我的代码,但由于无法在设备函数内使用printf,是否有其他方法可以查看该函数内发生了什么。这是我的当前函数:__global__ void MatrixMulKernel(Matrix Ad, Matrix Bd, Matrix Xd){ ...

34得票10回答
Python可用的最快SVM实现

我正在使用Python构建一些预测模型,并且一直在使用scikits-learn的SVM实现。它非常好用,易于使用,而且相对快速。 不幸的是,我的运行时间限制开始让我束手无策。我在约4-5000个数据样本和650个特征上运行了一个基于RBF的SVM,每次运行大约需要一分钟的时间。但是,在使用...

34得票2回答
CUDA的__shared__内存什么时候有用?

请给我一个非常简单的使用共享内存的例子,涉及到IT技术。CUDA C编程指南中提供的示例包含了许多无关的细节。 例如,如果我将一个大数组复制到设备全局内存中,并希望对每个元素进行平方运算,那么如何利用共享内存来加速呢?或者在这种情况下不使用共享内存是否更好?

33得票4回答
OpenMP能在GPU上使用吗?

我在网上搜索了很多,但是对这个话题仍然感到非常困惑。有人能更清楚地解释一下吗?我来自航空航天工程背景(不是计算机科学),所以当我在网上阅读关于OpenMP/CUDA等多线程的内容时,我并不真正理解其中的大部分。 我目前正在尝试将用FORTRAN编写的内部CFD软件并行化。以下是我的疑问: ...