例如,在Caffe中,应该在内积(全连接)层中定义num_output。这个输出数字的意义是什么?
1xN
矩阵和一个NxM
矩阵进行简单的矩阵乘法运算,得到一个维度为1xM
的结果。56x56x3
的数据作为全连接层的输入,并且权重的维度为未知的NxM
。假设我们设置num_output= 4096
。56x56x3
维度的输入数据重新塑形为1xN
,即1x(56x56x3)= 1x9408
。实际上,我们需要执行N = 9408
M = num_output = 4096
(1x9408)矩阵-(9408x4096)矩阵
乘法运算。num_output
值更改为例如100
,则会执行(1x9408)矩阵-(9408x100)矩阵
乘法运算。num_output
值将增加模型学习的权重参数数量。