我没有找到这样的内置函数,我有一个想法。
y=x'*A*x
可以写成
A(i,j)*x(i)*x(j)
的
n^2
项和,其中
i
和
j
运行从 1 到 n(其中
A
是一个
nxn
矩阵)。
A
是对称的:对于所有的
i
和
j
,有
A(i,j) = A(j,i)
。由于对称性,在和中每个项都出现了两次,除了那些
i
等于
j
的项。因此我们有
n*(n+1)/2
种不同的项。每个项有两个浮点乘法,所以天真的方法需要总共
n*(n+1)
个乘法。很容易看出,天真的计算
x'*A*x
,即计算
z=A*x
,然后
y=x'*z
,也需要
n*(n+1)
个乘法。然而,有一种更快的方法来求和我们的
n*(n+1)/2
不同的项:对于每个
i
,我们可以分解出
x(i)
,这意味着只需要
n*(n-1)/2+3*n
个乘法就足够了。但这并不能真正帮助:计算
y=x'*A*x
的运行时间仍然是
O(n^2)
。
因此,我认为二次形式的计算不能比
O(n^2)
更快,由于这也可以通过公式
y=x'*A*x
实现,所以特殊的“quadraticform”函数没有真正的优势。
=== 更新 ===
我已经用 C 写了一个名为“quadraticform”的函数,作为 Matlab 扩展。
#include "mex.h"
#define A_in prhs[0]
#define x_in prhs[1]
#define y_out plhs[0]
void mexFunction(int nlhs, mxArray *plhs[], int nrhs, const mxArray *prhs[])
{
mwSize mA, nA, n, mx, nx;
double *A, *x;
double z, y;
int i, j, k;
if (nrhs != 2) {
mexErrMsgTxt("Two input arguments required.");
} else if (nlhs > 1) {
mexErrMsgTxt("Too many output arguments.");
}
mA = mxGetM(A_in);
nA = mxGetN(A_in);
if (mA != nA)
mexErrMsgTxt("The first input argument must be a quadratic matrix.");
n = mA;
mx = mxGetM(x_in);
nx = mxGetN(x_in);
if (mx != n || nx != 1)
mexErrMsgTxt("The second input argument must be a column vector of proper size.");
A = mxGetPr(A_in);
x = mxGetPr(x_in);
y = 0.0;
k = 0;
for (i = 0; i < n; ++i)
{
z = 0.0;
for (j = 0; j < i; ++j)
z += A[k + j] * x[j];
z *= x[i];
y += A[k + i] * x[i] * x[i] + z + z;
k += n;
}
y_out = mxCreateDoubleScalar(y);
}
我将这段代码保存为“quadraticform.c”,并使用Matlab进行编译:
mex -O quadraticform.c
我写了一个简单的性能测试,以比较这个函数与x'Ax的表现:
clear all; close all; clc;
sizes = int32(logspace(2, 3, 25));
nsizes = length(sizes);
etimes = zeros(nsizes, 2);
nrepeats = 100;
h = waitbar(0, 'Please wait...');
for i = 1 : nrepeats
for j = 1 : nsizes
n = sizes(j);
A = randn(n);
A = (A + A') / 2;
x = randn(n, 1);
if randn > 0
start = tic;
y1 = x' * A * x;
etimes(j, 1) = etimes(j, 1) + toc(start);
start = tic;
y2 = quadraticform(A, x);
etimes(j, 2) = etimes(j, 2) + toc(start);
else
start = tic;
y2 = quadraticform(A, x);
etimes(j, 2) = etimes(j, 2) + toc(start);
start = tic;
y1 = x' * A * x;
etimes(j, 1) = etimes(j, 1) + toc(start);
end;
if abs((y1 - y2) / y2) > 1e-10
error('"x'' * A * x" is not equal to "quadraticform(A, x)"');
end;
waitbar(((i - 1) * nsizes + j) / (nrepeats * nsizes), h);
end;
end;
close(h);
clear A x y;
etimes = etimes / nrepeats;
n = double(sizes);
n2 = n .^ 2.0;
i = nsizes - 2 : nsizes;
n2_1 = mean(etimes(i, 1)) * n2 / mean(n2(i));
n2_2 = mean(etimes(i, 2)) * n2 / mean(n2(i));
figure;
loglog(n, etimes(:, 1), 'r.-', 'LineSmoothing', 'on');
hold on;
loglog(n, etimes(:, 2), 'g.-', 'LineSmoothing', 'on');
loglog(n, n2_1, 'k-', 'LineSmoothing', 'on');
loglog(n, n2_2, 'k-', 'LineSmoothing', 'on');
axis([n(1) n(end) 1e-4 1e-2]);
xlabel('Matrix size, n');
ylabel('Running time (a.u.)');
legend('x'' * A * x', 'quadraticform(A, x)', 'O(n^2)', 'Location', 'NorthWest');
W = 16 / 2.54; H = 12 / 2.54; dpi = 100;
set(gcf, 'PaperPosition', [0, 0, W, H]);
set(gcf, 'PaperSize', [W, H]);
print(gcf, sprintf('-r%d',dpi), '-dpng', 'quadraticformtest.png');
结果非常有趣。无论是
x'*A*x
还是
quadraticform(A,x)
的运行时间都收敛于
O(n^2)
,但前者的因子更小:
![quadraticformtest.png](https://istack.dev59.com/bCAzV.webp)