我正在尝试使用NumbaPro的cuda扩展程序来乘以大型数组矩阵。最终我想要的是将一个大小为NxN的矩阵乘以一个作为1D矩阵提供的对角线矩阵(因此,a.dot(numpy.diagflat(b))相当于a * b)。但是,我遇到了一个没有提供任何信息的断言错误。
只有当我乘以两个1D数组矩阵时,才能避免这种断言错误,但这不是我想做的事情。
这是我的终端输出内容:
只有当我乘以两个1D数组矩阵时,才能避免这种断言错误,但这不是我想做的事情。
from numbapro import vectorize, cuda
from numba import f4,f8
import numpy as np
def generate_input(n):
import numpy as np
A = np.array(np.random.sample((n,n)))
B = np.array(np.random.sample(n) + 10)
return A, B
def product(a, b):
return a * b
def main():
cu_product = vectorize([f4(f4, f4), f8(f8, f8)], target='gpu')(product)
N = 1000
A, B = generate_input(N)
D = np.empty(A.shape)
stream = cuda.stream()
with stream.auto_synchronize():
dA = cuda.to_device(A, stream)
dB = cuda.to_device(B, stream)
dD = cuda.to_device(D, stream, copy=False)
cu_product(dA, dB, out=dD, stream=stream)
dD.to_host(stream)
if __name__ == '__main__':
main()
这是我的终端输出内容:
Traceback (most recent call last):
File "cuda_vectorize.py", line 32, in <module>
main()
File "cuda_vectorize.py", line 28, in main
cu_product(dA, dB, out=dD, stream=stream)
File "/opt/anaconda1anaconda2anaconda3/lib/python2.7/site-packages/numbapro/_cudadispatch.py", line 109, in __call__
File "/opt/anaconda1anaconda2anaconda3/lib/python2.7/site-packages/numbapro/_cudadispatch.py", line 191, in _arguments_requirement
AssertionError
_cudadispatch.py
的第191行,看看断言是什么? - BenC