一个设备使用多个CUDA上下文有意义吗？

Question

11

我原以为自己已经掌握了这个技术，但事实上并不是这样：）我需要使用NVENC从不符合编码器要求的帧中执行并行H.264流编码，因此我有以下代码流程：

由于某种原因，我认为如果在并行线程中执行此管道，则需要为每个线程使用专用上下文。代码很慢，在阅读一些文章之后，我了解到上下文切换实际上是昂贵的，然后我确实得出结论，这是没有意义的，因为一个上下文拥有整个GPU，因此我锁定了其他转码器线程的任何并行处理。

问题1：在这种情况下，我是否可以使用单个上下文和在该上下文上创建的显式流来执行所述管道的每个线程？

问题2：有人可以让我了解CUDA设备上下文的唯一目的是什么吗？我认为在多GPU情况下，这是有意义的，但是否有任何情况需要为一个GPU创建多个上下文？

- Rudolfs Bundulis

什么是NVCENC？我听说过NVENC和NVCUVENC。 - Robert Crovella

@RobertCrovella，我的错，NVENC 拼错了。 - Rudolfs Bundulis

2个回答

2

显然，已经过去了几年，但是自2019年9月左右的视频编解码器SDK 9.1版本以来，NVENC / NVDEC现在似乎具有CUstream支持：https://developer.nvidia.com/nvidia-video-codec-sdk/download

新功能9.1-编码：NVENC中的CUStream支持，可增强CUDA预处理和NVENC编码之间的并行性

我对CUDA非常陌生，但是我的基本理解是，CUcontexts允许多个进程使用GPU（通过进行上下文交换来打断彼此的工作），而CUstreams则允许在单个进程内协调共享GPU资源。

- aggieNick02

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Robert Crovella · Accepted Answer

问题1：在这种情况下，我使用一个单一的上下文和为每个执行所述流水线的线程创建的显式流是否可行？

你可以使用单一的上下文。

问题2：有人能告诉我CUDA设备上下文的唯一目的是什么吗？我假设在多GPU场景中使用它会很有意义，但是否存在需要为一个GPU创建多个上下文的情况？

CUDA设备上下文在编程指南中有介绍。它表示与特定进程（即与该特定进程使用GPU相关联）关联的所有状态（内存映射、分配、内核定义和其他状态相关信息）。通常，不同进程将具有不同的上下文（以及不同的设备），因为这些进程具有独立的GPU使用和独立的内存映射。

如果你在一个GPU上有多进程使用，通常会在该GPU上创建多个上下文。正如你已经发现的那样，可以从单个进程创建多个上下文，但通常并不需要。

当你有多个上下文时，这些上下文中启动的内核需要进行上下文切换，以便从一个上下文中的一个内核切换到另一个上下文中的另一个内核。这些内核无法并发运行。

CUDA运行时API使用会为你管理上下文。当使用运行时API时，通常不需要明确与CUDA上下文交互。然而，在驱动程序API使用中，上下文是显式创建和管理的。