我需要计算形如下面的标量积:
T'*log(T)
其中T
是一个非常大的Kronecker乘积,形式如下:
T = 1;
for k=1:100
T = kron(T, p(:,k));
end
这段代码中,p
是一个大小为 5 x 100
的整数矩阵。
由于最终结果是标量,所以不需要生成 Kronecker 乘积数组,可以直接在线求和。但是,每个 p(:,k)
通常只有约 3 种唯一值:这总共会产生大约 3^100
种组合,相当于 10^47
,数量巨大。
您认为我能使用 GPU 或 FPGA 在几周内计算出这些组合吗?