OpenGL着色器 - 相机平移应该在GPU还是CPU上进行？

Question

3

目前我所做的工作是在将我的元素加载到VBO之前，创建一个新的矩阵并将它们添加到其中。我这样做是因为我想尽可能多地操作这个矩阵。

所以我只是在矩阵中的坐标上添加了相机位置。

注意：对象的实际位置保存在其他地方，矩阵只是用来作为一个平移阶段。

现在，这种方法可以运行，但我不确定是否正确，或者我应该在GPU中而不是在CPU中进行相机定位。

我的问题是：

相机的定位应该在GPU还是CPU上进行？

- Amit Assaraf

你是说，每一帧都要通过矩阵乘法来改变顶点数据？每个物体的每个顶点都要乘以同一个矩阵？这是在CPU上进行的吗？ - Nicol Bolas

每一帧我都会为每个对象创建一个矩阵，然后在该矩阵上应用缩放、旋转和平移。 - Amit Assaraf

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Invalid · Accepted Answer

我不确定您目前在做什么。但是，做这件事的明智方法是不要触碰VBO。相反，将一个或多个变换矩阵作为uniform传递到顶点着色器中，并在GPU上执行矩阵乘法。

在CPU上更改VBO数据是不明智的，这意味着要么在CPU上保留顶点数据的副本，迭代并上传它，要么映射缓冲区并迭代它。无论哪种方式，速度都会非常慢。拥有VBO的整个目的是让您只需上传一次顶点数据，就可以同时在CPU上工作，而GPU则使用该顶点数据进行其操作。

相反，您只需将顶点存储在顶点缓冲区中一次，最好是在对象空间中（仅出于安全起见）。然后，对于每个对象，您需要跟踪一个转换矩阵，该矩阵将顶点从对象空间转换为裁剪空间。您将该矩阵传递给顶点着色器，并在GPU上为每个顶点执行乘法。

显然，GPU每帧至少将每个顶点乘以一个矩阵。但是，GPU具有并行硬件，可以快速执行矩阵乘法。因此，尤其是当您的矩阵经常更改（例如，对象移动）时，这比在CPU上进行更新的大缓冲区要快得多。此外，您可以将CPU释放出来执行其他任务，例如物理或音频等。

现在我可以想象，如果您的对象从不移动，您可能不想这样做，但是GPU矩阵乘法的速度可能与CPU浮点乘法相同（我不知道具体情况）。因此，对于静态对象是否拥有更多着色器还有待商榷。

总结：

希望这有所帮助。