C和C++函数double floor(double arg)(定义在cmath和math.h中)返回不大于arg的最大整数值。使用AVX指令矢量化此过程的最有效方法是什么? 本质上,我想要的是: __m256d floor(__m256d arg); 需要将其转换为整数吗?
CVTTSD2SI r64,xmm/m64
。好在有SSE4.1roundpd
。:P - Peter Cordes