调用always_inline‘_mm_mullo_epi32’时内联失败:目标特定选项不匹配。

26

我正在尝试使用cmake编译一个使用SIMD指令的C程序。 当我尝试编译它时,我遇到了两个错误:

/usr/lib/gcc/x86_64-linux-gnu/5/include/smmintrin.h:326:1:错误:调用always_inline‘_mm_mullo_epi32’失败:目标特定选项不匹配 _mm_mullo_epi32 (__m128i __X, __m128i __Y)

/usr/lib/gcc/x86_64-linux-gnu/5/include/tmmintrin.h:136:1:错误:调用always_inline‘_mm_shuffle_epi8’失败:目标特定选项不匹配 _mm_shuffle_epi8 (__m128i __X, __m128i __Y)

这个问题已经在StackOverflow中解决,方法是设置:

set(CMAKE_CXX_FLAGS "${CMAKE_CXX_FLAGS} -msse4.1")

我尝试了相同的和许多其他选项。 但我的项目仍无法编译。

set(CMAKE_CXX_FLAGS "${CMAKE_CXX_FLAGS} -msse4.1")  
set(CMAKE_CXX_FLAGS "${CMAKE_CXX_FLAGS} -sse4_1")  
set(CMAKE_CXX_FLAGS "${CMAKE_CXX_FLAGS} -march=nehalem")  
set(CMAKE_CXX_FLAGS "${CMAKE_CXX_FLAGS} -msse4.1 -msse4.2")  
set(CMAKE_CXX_FLAGS "${CMAKE_CXX_FLAGS} -march=native")  
set(CMAKE_CXX_FLAGS "${CMAKE_CXX_FLAGS} -ssse3")  
2个回答

21

寻找gcc指令切换的通用方法

文件intrin.sh:

#!/bin/bash

get_instruction ()
{
    [ -z "$1" ] && exit
    func_name="$1 "

    header_file=`grep --include=\*intrin.h -Rl "$func_name" /usr/lib/gcc | head -n1`
    [ -z "$header_file" ] && exit
    >&2 echo "find in: $header_file"

    target_directive=`grep "#pragma GCC target(\|$func_name" $header_file | grep -B 1 "$func_name" | head -n1`
    echo $target_directive | grep -o '"[^,]*[,"]' | sed 's/"//g' | sed 's/,//g'
}

instruction=`get_instruction $1`
if [ -z "$instruction" ]; then
    echo "Error: function not found: $1"
else
    echo "add this option to gcc: -m$instruction"
fi

使用方法:

./intrin.sh _mm_shuffle_epi8      # output: -mssse3
./intrin.sh _mm_cvtepu8_epi32     # output: -msse4.1
./intrin.sh _mm_loadu_ps          # output: -msse
./intrin.sh _mm_clmulepi64_si128  # output: -mpclmul
./intrin.sh _mm256_loadu_si256    # output: -mavx
./intrin.sh _mm512_and_ps         # output: -mavx512dq

2
注意,通常最好使用类似-march=haswell的选项,而不仅仅使用-mavx2 -mfma。或者至少在您的-m ISA选项中添加-mtune=znver2(Zen 2)或其他内容。对于可能未对齐的256位向量,"通用"调整可能非常差,特别是当您的数据通常在运行时对齐但编译器不知道时。请参见为什么gcc不能将_mm256_loadu_pd解析为单个vmovupd?。或者,如果您想为自己的机器制作二进制文件,请使用-march=native - Peter Cordes
太好了,回答得非常棒! - f10w

19

由于你正在编译C代码而不是C++,所以你需要:

set(CMAKE_C_FLAGS "${CMAKE_C_FLAGS} -msse4.1")

您可以删除所有其他的 -march XXX-msseXXX 设置。

如果您同时使用 C 和 C++,还可以添加:

set(CMAKE_CXX_FLAGS "${CMAKE_CXX_FLAGS} -msse4.1")

2
我不得不添加-maes,否则它对我没有用。 set(CMAKE_CXX_FLAGS "${CMAKE_CXX_FLAGS} -msse4.1 -maes") - Rostfrei
5
如果为您自己的机器编译,最好使用“-march=native”。这将启用您的CPU的所有功能,并设置优化选项。 - Peter Cordes

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接