我希望能够测量每个线程在执行代码块时所花费的时间。我想知道我的负载均衡策略是否能够平均地分配工作任务。通常,我的代码如下所示:
#pragma omp parallel for schedule(dynamic,chunk) private(i)
for(i=0;i<n;i++){
//loop code here
}
更新 我正在使用带有gcc的openmp 3.1