在CUDA CC 3.0中,新的l1_shared_bank_conflict
(或等效项)计数器是什么?在CUPTI用户指南中,它说是shared_[load|store]_bank_conflict
,但我尝试时没有显示。
我正在Linux中使用命令行分析器。
在CUDA CC 3.0中,新的l1_shared_bank_conflict
(或等效项)计数器是什么?在CUPTI用户指南中,它说是shared_[load|store]_bank_conflict
,但我尝试时没有显示。
我正在Linux中使用命令行分析器。
一些新的计数器不被旧的命令行分析器支持。如果你正在使用CUDA 5,可以尝试使用nvprof:
nvprof --events l1_shared_bank_conflict <app_name>
nvprof --query-events