在 C++17 中,我想使用几个 OpenBLAS 子程序,并为每个子程序使用不同数量的线程。有什么办法可以实现这一点吗?
过去,我曾经使用 openblas_set_num_threads() 函数来设置我的 OpenBLAS 子程序所使用的线程数。虽然这个方法可行,但它会将全局的 OpenBLAS 线程数设置为一个值,这样每个子程序在并行运行时都会使用相同数量的线程。因此,我只能为所有的 OpenBLAS 子程序使用相同数量的线程让它们并行运行。
过去,我曾经使用 openblas_set_num_threads() 函数来设置我的 OpenBLAS 子程序所使用的线程数。虽然这个方法可行,但它会将全局的 OpenBLAS 线程数设置为一个值,这样每个子程序在并行运行时都会使用相同数量的线程。因此,我只能为所有的 OpenBLAS 子程序使用相同数量的线程让它们并行运行。