假设纹理、顶点和着色器数据已经在图形卡上,你不需要向卡片发送太多数据。有一些字节用于标识数据,可能还有一个4x4矩阵和一些其他参数。
那么所有的开销都来自哪里呢?这些操作是否需要与GPU进行某种握手?
为什么发送包含一堆小模型的单个网格,由CPU计算而来,通常比发送顶点ID和变换矩阵更快?(第二个选项看起来应该发送更少的数据,除非模型比4x4矩阵小)
那么所有的开销都来自哪里呢?这些操作是否需要与GPU进行某种握手?
为什么发送包含一堆小模型的单个网格,由CPU计算而来,通常比发送顶点ID和变换矩阵更快?(第二个选项看起来应该发送更少的数据,除非模型比4x4矩阵小)