我正在尝试使用OpenCV 2.3中的反向传播算法训练神经网络,但它无法正确预测,即使是在训练数据集上也是如此。有人可以帮我找出问题在哪里吗?
training_feature_matrix - N x 69个浮点值的矩阵
training_age_matrix - N x 4个浮点值的矩阵
test_feature_matrix - M x 69个浮点值的矩阵
test_age_matrix - M x 4个浮点值的矩阵
以上提到的特征矩阵是这样的:[0.123435、0.4542665、0.587545、……68个这样的值+最后一个值“1.0或2.0”,取决于其性别)
以上提到的年龄矩阵是这样的:[1,0,0,0; 1,0,0,0; 0,1,0,0;……] 这里的1表示所属年龄类别(婴儿、儿童、成年人、老年人),与特征矩阵的相应行对应。
以下是代码: 使用上述矩阵作为参数调用'mlp'函数。
training_feature_matrix - N x 69个浮点值的矩阵
training_age_matrix - N x 4个浮点值的矩阵
test_feature_matrix - M x 69个浮点值的矩阵
test_age_matrix - M x 4个浮点值的矩阵
以上提到的特征矩阵是这样的:[0.123435、0.4542665、0.587545、……68个这样的值+最后一个值“1.0或2.0”,取决于其性别)
以上提到的年龄矩阵是这样的:[1,0,0,0; 1,0,0,0; 0,1,0,0;……] 这里的1表示所属年龄类别(婴儿、儿童、成年人、老年人),与特征矩阵的相应行对应。
以下是代码: 使用上述矩阵作为参数调用'mlp'函数。
cv::Mat mlp(cv::Mat& training_feature_matrix, cv::Mat& training_age_matrix, cv::Mat& test_feature_matrix, cv::Mat& test_age_matrix)
{
cv::Mat layers = cv::Mat(3, 1, CV_32SC1);
layers.row(0) = cv::Scalar(69);
layers.row(1) = cv::Scalar(36);
layers.row(2) = cv::Scalar(4); // cout<<layers<<"\n";
CvANN_MLP ann;
CvANN_MLP_TrainParams params;
CvTermCriteria criteria;
criteria.max_iter = 10000;
criteria.epsilon = 0.001;
criteria.type = CV_TERMCRIT_ITER + CV_TERMCRIT_EPS;
params.train_method = CvANN_MLP_TrainParams::BACKPROP;
params.bp_dw_scale = 0.1;
params.bp_moment_scale = 0.1;
params.term_crit = criteria;
ann.create(layers, CvANN_MLP::SIGMOID_SYM);
ann.train(training_feature_matrix, training_age_matrix, cv::Mat(), cv::Mat(), params);
cv::Mat predicted(test_age_matrix.rows, 4, CV_32SC1);
for(int i = 0; i < test_feature_matrix.rows; i++)
{
cv::Mat response(1, 4, CV_32F);
cv::Mat sample = test_feature_matrix.row(i);
ann.predict(sample, response);
for (int g = 0; g < 4; g++)
{
predicted.at<int>(i,g) = response.at<float>(0,g);
}
}
cout << "\n";
cout << ann.get_weights(0) << "\n";
cout << ann.get_layer_sizes() << "\n";
cout << ann.get_layer_count() << "\n\n";
return predicted;
}
编辑 另外,ann.get_weights(0)和ann.get_layer_sizes()返回的值是垃圾值,但是ann.get_layer_count()返回正确的值3。
谢谢 :)