我正在使用以下命令编译我的代码:
gcc -O3 -ftree-vectorizer-verbose=6 -msse4.1 -ffast-math
使用此选项将启用所有优化。
但是我想在保留其他优化的同时禁用向量化。
我正在使用以下命令编译我的代码:
gcc -O3 -ftree-vectorizer-verbose=6 -msse4.1 -ffast-math
使用此选项将启用所有优化。
但是我想在保留其他优化的同时禁用向量化。
大多数GCC开关可以使用 no
前缀来禁用它们的行为。在命令行上使用 -O3
后尝试使用 -fno-tree-vectorize
。
__attribute__((optimize("no-tree-vectorize")))
void f(double * restrict a, double * restrict b)
{
for (int i = 0; i < 256; i++)
a[i] += b[i];
}
非常好,现在gcc在矢量化方面变得更加积极,例如:
extern "C" __attribute__((optimize("no-tree-vectorize")))
/* Subroutine */
int s111_ (integer * ntimes, integer * ld, integer * n,
real * ctime, real * dtime,
real * __restrict a, real * b, real * c__, real * d__,
real * e, real * aa, real * bb, real * cc)
{
....
for (i__ = 2; i__ <= i__2; i__ += 2)
a[i__] = a[i__ - 1] + b[i__];
....
restrict
以前可以完成任务,但现在通过删除__restrict
无法阻止g++ 6.0进行向量化。
-mno-sse
,您需要完全避免任何FP数学运算(至少在函数调用/返回中)。对于内核代码之类的东西,避免任何FP数学运算通常足以避免函数内的任何x87指令,并且即使没有SSE2,GCC也不会自动向量化MMX指令,因此通常不需要-mno-mmx
。 - Peter Cordes