在C++中使用OpenMP并行求解数组的总和

3

我在C++中有一个for循环,需要大量计算时间,我想使用OpenMP(我有16个可用核心)进行并行化。我的代码中的其他简单for循环和FFT已经使用OpenMP并行化,并且运作良好。我尝试了一些选项,但结果与串行计算相差甚远(数量级不同)。

我的代码对应部分基本上如下所示:

for (i1=1;i1<N;i1++){
    function(Nx, Ny, i1, k, vector_1, vector_2);
    for (i=0;i<(Nx*Ny);i++){
        vector_3[i] = I*kx[i/Ny]*vector_2[i];
    }
    for (i=0;i<(Nx*Ny);i++){
        sum[i1-1] -= vector_2[i];
    }

    fftw_execute(p_c2r_4);
    #pragma omp parallel for default(shared)
    for (i=0;i<(Nx*Ny);i++){
        vector_4[i] = vector_4[i]/norm;
    }

    for (i2=1;i2<N;i2++){
    function(Nx, Ny, i2, k, vector_1, vector_2);
        for (i=0;i<(Nx*Ny);i++){
            Trans[(i1-1)*N + (i2-1)] -= creal( vector_2[i]*vector_4[i] );
        }
    }
}

其中一个for循环已经并行化了,所以我的目标是并行化其余部分。对于求和,我看到其他人使用reduction(+:sum),但在我的情况下,sum是一个数组,并且在编译时出现错误。

有人能给我一些提示吗?因为这是我代码的一个很大瓶颈。


你放置了哪些 #pragmas? - ChronoTrigger
我尝试在每个循环中使用#pragma omp parallel for default(shared),但结果完全错误。然后我尝试将一些变量设为私有,例如private(i1,k,vector_1,vector_2),但这只是一种绝望的尝试,也没有起作用。 - Fortran_user
摆弄计划子句。如果你的循环计数不是编译时常量,那么动态或引导可能会更好。 - Zan Lynx
1个回答

3
第一个for循环应该与第三个类似。
计算总和时,有一个小问题,即sum[]数组使用第一个循环索引进行索引,从而似乎混淆了编译器。为了让机器更容易理解,您可以尝试:
double subsum=0.0;
#pragma omp parallel for default(shared) reduction(+:subsum)
for (i=0;i<(Nx*Ny);i++){
    subsum += vector_2[i];
}
sum[i1-1] -= subsum;

用第四个方法,你可能可以使用类似的技巧。

#pragma ...之后和for循环之前进行初始化double subsum=0.0是必要的吗? - Fortran_user
抱歉由于语法错误引入了问题,变量在被omp指令使用前必须先声明。并且在每个外部for循环中设置为0。 - ssavec

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接