对于《C++并发编程实战》代码的问题。

Question

对于《C++并发编程实战》代码的问题。

5

我正在阅读《C++并发编程实战》，在第32页（第2章）有这段代码。

template <typename Iterator, typename T>
struct accumulate_block
{
    void operator()(Iterator first, Iterator last, T &result)
    {
        result = std::accumulate(first, last, result);
    }
};
template <typename Iterator, typename T>
T parallel_accumulate(Iterator first, Iterator last, T init)
{
    unsigned long const length = std::distance(first, last);
    if (!length)
        return init;
    unsigned long const min_per_thread = 25;
    unsigned long const max_threads = (length + min_per_thread - 1) / min_per_thread;
    unsigned long const hardware_threads = std::thread::hardware_concurrency();
    unsigned long const num_threads = std::min(hardware_threads != 0 ? hardware_threads : 2, max_threads);
    unsigned long const block_size = length / num_threads;
    std::vector<T> results(num_threads);
    std::vector<std::thread> threads(num_threads - 1);
    Iterator block_start = first;
    for (unsigned long i = 0; i < (num_threads - 1); ++i)
    {
        Iterator block_end = block_start;
        std::advance(block_end, block_size);
        threads[i] = std::thread(accumulate_block<Iterator, T>(),
                                 block_end, std::ref(results[i]));
        block_start = block_end;
    }
 accumulate_block<Iterator,T(block_start,last,results[num_threads-1]); 
 
 for(auto& entry: threads)
     entry.join(); 
 return std::accumulate(results.begin(),results.end(),init);
}

我不明白一些事情。

1. 为什么作者选择25作为min_per_thread？这只是一个随意的数字还是有一定考虑在其中？

2. 我不理解这段代码中的公式。

unsigned long const max_threads=
 (length+min_per_thread-1)/min_per_thread;

为什么我们要使用这个公式来找到“最大线程数”，以及我们需要它做什么？

我尝试搜索与这段代码相关的其他类似问题，但没有找到任何结果。

- BIuesky

为了仅仅处理几个元素而启动一个新线程是不值得的，所以作者进行了一些测试，并发现每个线程处理25个元素是一个合理的数量。
这只是将其四舍五入到下一个25的倍数。

- BoP

你用的是哪一版的书？我有第一版和第二版，但都没有这个代码在第55页。 - Daniel Langr

你用的是哪个版本的书？我有第一版和第二版，但是在它们的第55页上都没有这个代码。 - Daniel Langr

1

@DanielLangr 不好意思，是在第32页。 - BIuesky

1

@DanielLangr 对不起，是在第32页。 - BIuesky

显示剩余2条评论

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Vlad from Moscow · Accepted Answer

为什么作者选择25作为min_per_thread？这只是一个任意的数字还是背后有一定的考虑呢？

数字25是一个任意的数字。你可以根据自己的喜好使用任何数字。

我不理解这段代码中的公式。

unsigned long const max_threads=
 (length+min_per_thread-1)/min_per_thread;

当你除以一个数字，比如说13（长度）除以4（每个线程的最小值），由于整数运算，你会得到3。余数等于1，所以你只提供了3个线程来处理范围[0, 3]、[4, 7]和[8, 11]，但是元素12没有被分配到任何线程。你需要为余数提供一个线程。

你可以这样写：

13 + (4 - 1) 等于16，16除以4等于4。现在所有包含在余数范围内的区间都有自己的线程。

例如，如果长度等于12，那么增加的值min_per_thread - 1不会影响所需的线程数量，在这种情况下仍然是3个。

一般来说，余数可以是范围内的任何值[0, min_per_thread - 1]。

特别地，如果length小于min_per_thread，那么使用不带操作数min_per_thread - 1的表达式，你会得到max_threads等于0，尽管无论如何都需要一个线程。