我有一个离散的NVIDIA GPU(比如Kepler或Maxwell)。我想在一些核函数被调度之前清除我的L2缓存,以避免污染我的测试结果。
我可以做一些像分配一个大块内存并顺序读取它的东西,那可能会起作用。但我更愿意做一些更简单的事情...
注意:
我可以做一些像分配一个大块内存并顺序读取它的东西,那可能会起作用。但我更愿意做一些更简单的事情...
注意:
- 我也对如何在OpenCL中完成此操作感兴趣,尽管不是非常感兴趣。
- PTX内联是可以接受的(但我宁愿编写适当的代码)。