对于《C++并发编程实战》代码的问题。

5
我正在阅读《C++并发编程实战》,在第32页(第2章)有这段代码。
template <typename Iterator, typename T>
struct accumulate_block
{
    void operator()(Iterator first, Iterator last, T &result)
    {
        result = std::accumulate(first, last, result);
    }
};
template <typename Iterator, typename T>
T parallel_accumulate(Iterator first, Iterator last, T init)
{
    unsigned long const length = std::distance(first, last);
    if (!length)
        return init;
    unsigned long const min_per_thread = 25;
    unsigned long const max_threads = (length + min_per_thread - 1) / min_per_thread;
    unsigned long const hardware_threads = std::thread::hardware_concurrency();
    unsigned long const num_threads = std::min(hardware_threads != 0 ? hardware_threads : 2, max_threads);
    unsigned long const block_size = length / num_threads;
    std::vector<T> results(num_threads);
    std::vector<std::thread> threads(num_threads - 1);
    Iterator block_start = first;
    for (unsigned long i = 0; i < (num_threads - 1); ++i)
    {
        Iterator block_end = block_start;
        std::advance(block_end, block_size);
        threads[i] = std::thread(accumulate_block<Iterator, T>(),
                                 block_end, std::ref(results[i]));
        block_start = block_end;
    }
 accumulate_block<Iterator,T(block_start,last,results[num_threads-1]); 
 
 for(auto& entry: threads)
     entry.join(); 
 return std::accumulate(results.begin(),results.end(),init);
}

我不明白一些事情。
1. 为什么作者选择25作为min_per_thread?这只是一个随意的数字还是有一定考虑在其中?
2. 我不理解这段代码中的公式。
unsigned long const max_threads=
 (length+min_per_thread-1)/min_per_thread; 

为什么我们要使用这个公式来找到“最大线程数”,以及我们需要它做什么?
我尝试搜索与这段代码相关的其他类似问题,但没有找到任何结果。

  1. 为了仅仅处理几个元素而启动一个新线程是不值得的,所以作者进行了一些测试,并发现每个线程处理25个元素是一个合理的数量。
  2. 这只是将其四舍五入到下一个25的倍数。
- BoP
你用的是哪一版的书?我有第一版和第二版,但都没有这个代码在第55页。 - Daniel Langr
你用的是哪个版本的书?我有第一版和第二版,但是在它们的第55页上都没有这个代码。 - Daniel Langr
1
@DanielLangr 不好意思,是在第32页。 - BIuesky
1
@DanielLangr 对不起,是在第32页。 - BIuesky
显示剩余2条评论
1个回答

3
为什么作者选择25作为min_per_thread?这只是一个任意的数字还是背后有一定的考虑呢?
数字25是一个任意的数字。你可以根据自己的喜好使用任何数字。
我不理解这段代码中的公式。
unsigned long const max_threads=
 (length+min_per_thread-1)/min_per_thread; 

当你除以一个数字,比如说13(长度)除以4(每个线程的最小值),由于整数运算,你会得到3。余数等于1,所以你只提供了3个线程来处理范围[0, 3]、[4, 7]和[8, 11],但是元素12没有被分配到任何线程。你需要为余数提供一个线程。
你可以这样写:
13 + (4 - 1) 等于16,16除以4等于4。现在所有包含在余数范围内的区间都有自己的线程。
例如,如果长度等于12,那么增加的值min_per_thread - 1不会影响所需的线程数量,在这种情况下仍然是3个。
一般来说,余数可以是范围内的任何值[0, min_per_thread - 1]
特别地,如果length小于min_per_thread,那么使用不带操作数min_per_thread - 1的表达式,你会得到max_threads等于0,尽管无论如何都需要一个线程。

1
算法运行时实际使用的线程数为std::min(hardware_threads!=0?hardware_threads:2,max_threads)。我相信这段代码只是为了确保在length小于min_per_thread的情况下,max_threads不会为0。 - Daniel Langr
1
算法运行时实际使用的线程数为std::min(hardware_threads!=0?hardware_threads:2,max_threads)。我相信这段代码只是为了确保在length小于min_per_thread的情况下,max_threads不会为0。 - Daniel Langr
关于有一个元素没有被任何线程覆盖的讨论,以及 max_threads 最终可能为0这一事实,都非常有道理。 感谢两位! - BIuesky
关于一个元素没有被任何线程覆盖的讨论以及max_threads最终可能为0的事实,都非常有道理。 感谢双方! - BIuesky
关于一个元素没有被任何线程覆盖的讨论,以及max_threads最终可能为0的事实,都非常有道理。 感谢你们两位! - undefined
@BIuesky 没有问题。欢迎你。:) - Vlad from Moscow

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接