27得票3回答
在Cython中调用点积和线性代数运算?

我正在尝试在Cython中使用numpy提供的点积、矩阵求逆和其他基本线性代数运算。例如,numpy.linalg.inv(求逆)、numpy.dot(点积)和X.t(矩阵/数组的转置)。从Cython函数调用numpy.*存在很大的开销,而且函数的其余部分都是用Cython编写的,所以我希望...

26得票4回答
Blas版本的R检测

有没有一种方法可以在R内部检测R所使用的BLAS版本?我正在使用Ubuntu,并安装了几个BLAS版本,但我不知道从R的角度来看哪一个是“活动”的! 我知道这里有一个帖子http://r.789695.n4.nabble.com/is-Rs-own-BLAS-td911515.html,其中...

24得票5回答
如何确保numpy BLAS库可用作动态加载库?

theano installation documentation指出,如果“BLAS libraries可作为动态加载库”,theano将默认使用来自numpy的BLAS库。但这在我的机器上似乎无法正常工作,出现错误消息。 如何查看numpy BLAS库是否可作为动态加载库? 如果它们不...

24得票1回答
使用BLAS实现更快的Python内积

我找到了这个有用的教程,介绍如何在Python中使用基于Cython实现的低级BLAS函数来大幅提高标准numpy线性代数库的运算速度。现在,我已经成功地让向量乘积正常工作了。首先,我将以下代码保存为linalg.pyx:import cython import numpy as np cim...

24得票2回答
将ATLAS/MKL链接到已安装的Numpy

TL;DR: 如何将ATLAS/MKL链接到现有的Numpy而无需重新构建。 我使用Numpy进行大矩阵计算时发现速度非常慢,因为Numpy只使用1个核心进行计算。经过许多搜索后,我发现我的Numpy没有链接到一些优化库,例如ATLAS/MKL。这是我的Numpy配置:>>&gt...

22得票1回答
复制BLAS矩阵乘法的性能:我能匹配它吗?

背景 如果你一直在关注我的帖子,我正在尝试复制Kazushige Goto的方阵乘法C = AB的开创性论文中发现的结果。我上一篇关于这个主题的文章可以在这里找到。在那个版本的代码中,我遵循Goto的内存分层和打包策略,使用128位SSE3指令集计算内核,计算C的2x8块。我的CPU是i5-...

19得票1回答
在Mac OS上安装C语言的LAPACK和BLAS库

我希望得到指导和网站,以下载LAPACK和BLAS库,并在我的C程序中使用。我也想知道如何将它们链接到终端上的gcc编译器。

19得票4回答
在BLAS中,元素级向量-向量乘法是什么?

是否有一种使用BLAS、GSL或其他高性能库进行矢量-矢量逐元素相乘的方法?

18得票1回答
如何检查是否已安装BLAS和ATLAS

我正在尝试将armadillo库安装到我的Linux系统(Ubuntu 12.04)上。在进行安装之前,需要先安装BOOST BLAS ATLAS和LAPACK。有没有一种方法可以检查这些库是否已经安装?

18得票2回答
Numpy、BLAS和CUBLAS

Numpy可以与不同的BLAS实现(MKL、ACML、ATLAS、GotoBlas等)"链接/编译"。这并非总是容易配置,但是是可行的。 那么,是否也可以将Numpy与NVIDIA的CUBLAS实现"链接/编译"呢? 我在网上找不到任何资源,在我花费太多时间尝试之前,我想确保它是否可能。