9得票1回答
如何检查我的Ubuntu系统中装有哪个BLAS库?

特别地,我想知道是否已经安装了xianyi的OpenBLAS。在过去的几年里,我在几台电脑上安装了它,但我不确定哪些电脑没有安装它。我需要知道哪台电脑有安装它,哪台没有。这是我安装它的方法: git clone git://github.com/xianyi/OpenBLAS cd Open...

9得票3回答
Julia内存分配:原位加法两个矩阵

我很好奇为什么Julia的矩阵加法实现似乎会复制数据。以下是一个示例: foo1=rand(1000,1000) foo2=rand(1000,1000) foo3=rand(1000,1000) julia> @time foo1=foo2+foo3; 0.001719 sec...

9得票1回答
在R中如何控制BLAS并行矩阵乘积的多线程?

我有一个关于在R中使用BLAS并行矩阵乘法的问题(至少自R-3.4以来就是默认矩阵乘法,可能更早)。 现在的默认行为(至少在我的机器上)是让矩阵乘积(参见下面的示例)使用机器上所有可用的核心,这可能会成为一个问题。 您知道如何控制在R中对标准矩阵乘积使用的核心数吗? 提前感谢。 示例:...

9得票2回答
我应该偏好步长为一的内存访问,无论是读取还是写入吗?

众所周知,以步幅一的方式访问内存对性能最好。 在以下情况下: - 我必须访问一个内存区域进行读取, - 我必须访问另一个内存区域进行写入,并且 - 我只能以步幅一的方式访问这两个区域中的一个, 那么我应该优先考虑读取步幅一还是写入步幅一? 一个简单、具体的例子是类似于BLAS的复制和置...

9得票2回答
使用Eigen中的BLAS和LAPACK

我使用Eigen实现了一段代码,我希望Eigen使用BLAS和LAPACK。 我在这里看到了可能的方法,但我不知道在代码中如何设置这些值/指令。 我必须在某个地方指定EIGEN_USE_BLAS值,但是我不知道应该在哪里设置。 我看到Eigen的源代码包含BLAS和LAPACK的代码,但...

9得票5回答
BLAS库与Fortran 77编译器设置不兼容。

我正在尝试在KDE桌面的Ubuntu 12.04上从源代码安装Octave-3.6.2,但当我运行Octave配置脚本时,我遇到了以下错误: BLAS library was detected but found incompatible with your Fortran 77 comp...

9得票1回答
使用Atlas和OpenBLAS对NumPy进行基准测试时出现奇怪的结果

我将尝试评估与ATLAS链接的NumPy与与OpenBLAS链接的NumPy的性能差异。我对ATLAS的结果有些奇怪,下面我将进行描述。 用于评估矩阵乘法(也称为sgemm)的Python代码如下: import sys sys.path.insert(0, "numpy-1.8.1") ...

9得票1回答
Numpy.dot有bug?NaN表现不一致。

我注意到在涉及nan和零值的情况下,numpy.dot表现不一致。有人能理解这是什么吗?这是一个bug吗?这是否特定于dot函数?我使用的是numpy v1.6.1版本,64位,在Linux上运行(也在v1.6.2上进行了测试)。我还在Windows 32位上测试了v1.8.0(因此无法确定差...

9得票3回答
使用GPU的Armadillo (+BLAS)

能否使用GPU运行armadillos计算?是否有办法使用GPU的blas库(例如cuBLAS)与armadillo一起使用?需要注意的是,我完全是新手,对GPU编程一窍不通。

9得票2回答
调用MATLAB内置的LAPACK/BLAS例程

我想学习如何在MATLAB中调用内置的LAPACK/BLAS例程。我有MATLAB和mex文件的经验,但实际上我不知道如何调用LAPACK或BLAS库。我在文件交换中找到了网关例程,简化了调用过程,因为我不必为任何函数编写mex文件,比如这个。我需要任何玩具示例来学习MATLAB和这些内置库之...