得票数最多 'blas' 问题 - 第2页

关联标签

55得票3回答

Fortran参考实现文档指出：* LDA - INTEGER. * On entry, LDA specifies the first dimension of A as declared * in the calling (sub) prog...

54得票3回答

我正在尝试使用 OpenBLAS 安装 numpy，但是我不知道应该如何编写 site.cfg 文件。按照安装步骤进行安装时，安装过程没有出现错误，但是增加 OpenBLAS 使用的线程数（由环境变量 OMP_NUM_THREADS 控制）会导致性能下降。我不确定 OpenBLAS 的...

50得票4回答

我正试图在Python中实现大量的矩阵-矩阵乘法。最初，我认为NumPy会自动使用我的线程化BLAS库，因为我已经构建了它并针对这些库进行了优化。但是，当我查看top或其他一些东西时，似乎代码根本没有使用线程。有什么想法是出了什么问题，或者我可以做些什么来轻松地使用BLAS性能呢？

44得票1回答

基于著名的check_blas.py脚本，我编写了这个脚本来检查theano是否能够使用多核心： import os os.environ['MKL_NUM_THREADS'] = '8' os.environ['GOTO_NUM_THREADS'] = '8' os.environ['OM...

39得票5回答

使用替代的BLAS库可以带来多个优势，例如请参考https://cran.r-project.org/web/packages/gcbd/vignettes/gcbd.pdf。 Microsoft R Open https://mran.revolutionanalytics.com/doc...

39得票3回答

我在不同的环境下（MacOS，Ubuntu，RedHat）都使用numpy和scipy。通常我会使用可用的包管理器（例如mac ports、apt、yum）安装numpy。然而，如果您没有手动编译Numpy，您如何确定它使用了BLAS库？使用mac ports时，ATLAS会被安装为依赖项。...

28得票2回答

做类似以下的事情 import numpy as np a = np.random.rand(10**4, 10**4) b = np.dot(a, a) 使用多个核心，运行效果良好。然而，a 中的元素是 64 位浮点数（或在 32 位平台上为 32 位浮点数？），我想要乘以 8 位...

28得票3回答

为什么BLAS有一个用于矩阵-矩阵乘法的gemm函数，以及一个用于矩阵-向量乘法的单独的gemv函数呢？难道矩阵-向量乘法不是矩阵-矩阵乘法的特殊情况，其中一个矩阵只有一行/列吗？

27得票6回答

我已经在Heroku上成功安装了Numpy和Matplotlib，现在我想要安装Scipy。然而，Scipy需要BLAS[1]来进行安装，而Heroku平台上并没有提供BLAS。在联系Heroku支持后，他们建议我构建一个静态库作为BLAS，并设置必要的环境变量。于是，我在一个64位Lin...

27得票5回答

假设我有一个双精度std::vector，即std::vector<double> MyVec(N); 假设N非常大，性能很重要。现在假设MyVec是一个非平凡的向量（即它不是一个零向量，而是通过某些例程进行了修改）。现在，我需要向量的相反数：我需要-MyVec。到目前为止，我...