在iOS Metal中为MTLBuffer使用的数据分配内存

Question

在iOS Metal中为MTLBuffer使用的数据分配内存

7

作为对此答案的跟进问题。我正在尝试用Metal中的内核函数替换在CPU上运行的for循环，以并行化计算并加快性能。

我的函数基本上是卷积。由于我反复接收到输入数组值的新数据（数据源自AVCaptureSession），因此使用newBufferWithBytesNoCopy:length:options:deallocator:创建MTLBuffer对象似乎是明智的选择。下面是相关代码：

id <MTLBuffer> dataBuffer = [device newBufferWithBytesNoCopy:dataVector length:sizeof(dataVector) options:MTLResourceStorageModeShared deallocator:nil];
id <MTLBuffer> filterBuffer = [device newBufferWithBytesNoCopy:filterVector length:sizeof(filterVector) options:MTLResourceStorageModeShared deallocator:nil];
id <MTLBuffer> outBuffer = [device newBufferWithBytesNoCopy:outVector length:sizeof(outVector) options:MTLResourceStorageModeShared deallocator:nil];

当运行此代码时，会出现以下错误：

``` failed assertion `newBufferWithBytesNoCopy:pointer 0x16fd0bd48 is not 4096 byte aligned.' ```

目前，我没有分配任何内存，但（为了测试目的）只是创建一个大小固定的空浮点数数组并用随机数填充它。因此，我的主要问题是：

如何正确地分配这些浮点数数组，以满足以下要求？

``` 该值必须导致页面对齐的内存区域。 ```

另外，还有一些额外的问题：

- 使用 `newBufferWithBytesNoCopy` 方法创建 `MTLBuffer` 是否有意义，或者复制数据在性能方面不是一个问题？（我的实际数据将包含每个视频帧约43000个浮点值。） - `MTLResourceStorageModeShared` 是否是 `MTLResourceOptions` 的正确选择？ - API 参考文档说：

``` 返回的新 MTLBuffer 对象的存储分配与指针输入值相同。现有内存分配必须由单个 VM 区域覆盖，通常使用 vm_allocate 或 mmap 分配。不允许使用 malloc 分配内存。 ```

这仅适用于输出缓冲区吗？还是所有用于 `MTLBuffer` 的对象的存储分配都不能使用 `malloc` 进行？

- Maxi Mus

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- warrenm · Accepted Answer

最简单的分配页面对齐内存的方法是使用 posix_memalign。以下是创建带有页面对齐内存的缓冲区的完整示例：

void *data = NULL;
NSUInteger pageSize = getpagesize();
NSUInteger allocationSize = /* required byte count, rounded up to next multiple of page size */ pageSize * 10;
int result = posix_memalign(&data, pageSize, allocationSize);

if (result == noErr && data) {
    id<MTLBuffer> buffer = [device newBufferWithBytesNoCopy:data
                                                     length:allocationSize
                                                    options:MTLResourceStorageModeShared
                                                deallocator:^(void *pointer, NSUInteger length)
                                                            {
                                                                free(pointer);
                                                            }];
    NSLog(@"Created buffer of length %d", (int)buffer.length);
}

由于您不能确保数据会到达页面对齐的指针，因此最好只分配一个能容纳您的数据的MTLBuffer，而不是使用不带副本的变体。如果您需要对数据进行实时处理，则应创建一个缓冲区池并在它们之间循环，而不是等待每个命令缓冲区完成。这些用例需要使用Shared存储模式。与malloc相关的警告仅适用于不带副本的情况，因为在其他情况下，Metal将为您分配内存。