假设使用64位架构,mt19937_64
的吞吐量(比特/秒)是否比32位版本mt19937
更高?
进行矢量化后呢?
假设使用64位架构,mt19937_64
的吞吐量(比特/秒)是否比32位版本mt19937
更高?
进行矢量化后呢?
正如@byjoe指出的那样,这显然取决于编译器。
在这种情况下,它似乎比通常更依赖于编译器。例如,在评论中链接的Boost测试使用了VC++ 2010的编译器,仅显示了从使用mt19937_64获得的随机位数每秒略微增加。
为了获得更多最新信息,我进行了一个简单的测试:
#include <random>
#include <chrono>
#include <iostream>
#include <iomanip>
template <class T, class U>
U test(char const *label, U count) {
using namespace std::chrono;
T gen(100);
U result = 0;
auto start = high_resolution_clock::now();
for (U i = 0; i < count; i++)
result ^= gen();
auto stop = high_resolution_clock::now();
std::cout << "Time for " << std::left << std::setw(12) << label
<< duration_cast<milliseconds>(stop - start).count() << "\n";
return result;
}
int main(int argc, char **argv) {
unsigned long long limit = 1000000000;
auto result1 = test<std::mt19937>("mt19937: ", limit);
auto result2 = test<std::mt19937_64>("mt19937_64: ", limit);
std::cout << "Ignore: " << result1 << ", " << result2 << "\n";
}
使用VC++ 2015更新3(带有/o2b2 /GL,尽管这可能并不重要),我得到了以下结果:
Time for mt19937: 4339
Time for mt19937_64: 4215
Ignore: 2598366015, 13977046647333287932
这表明mt19937_64每次调用比mt19937稍微快一些,因此每位速度是mt19937的两倍以上。使用MinGW(使用-O3)时,结果更像与从Boost网站链接的结果:
Time for mt19937: 2211
Time for mt19937_64: 4183
Ignore: 2598366015, 13977046647333287932
这显然取决于您的编译器及其实现。我刚刚进行了测试,64位版本每次调用所需的时间大约比32位版本长60%,因此64位版本的每个比特位速度大约快25%。我使用了i7 CPU 进行了测试。
如果您需要最大速度,则可能需要考虑使用其他工具。特别是如果数字不需要非常高的质量。