最近我也遇到了这个问题,以下是我为了让SVM能够处理图像而采取的方法。
要在一组图像上训练你的SVM,首先你需要构建SVM的训练矩阵。这个矩阵的规格如下:矩阵的每一行对应一个图像,该行中的每个元素都对应于该类别的一个特征--在这种情况下,是某个点的像素颜色。由于你的图像是二维的,所以你需要将它们转换成一个一维矩阵。每行的长度将是图像的面积(注意图像必须是相同大小的)。
假设你想在5张不同的图片上训练SVM,每张图片都是4x3像素。首先,你需要初始化训练矩阵。矩阵的行数将是5,列数将是图像的面积,即4*3 = 12。
int num_files = 5;
int img_area = 4*3;
Mat training_mat(num_files,img_area,CV_32FC1);
理想情况下,
num_files
和
img_area
不应该是硬编码的,而是通过循环遍历目录并计算图像数量以及获取实际图像面积来获得。
下一步是使用每个图像的数据“填充”
training_mat
的行。以下是如何为一行进行映射的示例。
我已经为图像矩阵中的每个元素分配了一个编号,指示它在训练矩阵中对应行中的位置。例如,如果这是第三张图片,则在训练矩阵中,这将是第三行。
你需要循环遍历每个图像,并相应地设置输出矩阵中的值。以下是多个图像的示例:
关于如何在代码中实现这一点,您可以使用
reshape()
,但是由于矩阵不连续,我遇到了一些问题。根据我的经验,我会做类似于以下的事情:
Mat img_mat = imread(imgname,0); // I used 0 for greyscale
int ii = 0; // Current column in training_mat
for (int i = 0; i<img_mat.rows; i++) {
for (int j = 0; j < img_mat.cols; j++) {
training_mat.at<float>(file_num,ii++) = img_mat.at<uchar>(i,j);
}
}
针对每个训练图像执行此操作(记得递增
file_num
)。完成后,您应该已经正确设置了训练矩阵以便传入SVM函数。其余步骤与在线示例非常相似。
请注意,在执行此操作时,您还必须为每个训练图像设置标签。例如,如果您基于图像对眼睛和非眼睛进行分类,则需要指定训练矩阵中的哪一行对应于眼睛和非眼睛。这是指定为1D矩阵的,其中1D矩阵中的每个元素对应于2D矩阵中的每一行。为每个类别选择值(例如,非眼睛为-1,眼睛为1)并将其设置在标签矩阵中。
Mat labels(num_files,1,CV_32FC1);
如果在这个
labels
矩阵中的第三个元素为-1,那么意味着训练矩阵中的第三行属于“非眼”类。您可以在评估每个图像的循环中设置这些值。您可以将训练数据按类别分别排序到不同的目录中,并循环遍历每个目录中的图像,并根据目录设置标签。
接下来要做的是设置SVM参数。这些值将根据您的项目而变化,但基本上您需要声明一个
CvSVMParams
对象并设置这些值:
CvSVMParams params;
params.svm_type = CvSVM::C_SVC;
params.kernel_type = CvSVM::POLY;
params.gamma = 3;
// ...etc
有许多关于如何设置这些参数的在线示例,比如您在问题中发布的链接。
接下来,您需要创建一个 CvSVM
对象并基于您的数据进行训练!
CvSVM svm;
svm.train(training_mat, labels, Mat(), Mat(), params);
根据数据量的大小,这可能需要很长时间。然而,在训练完成后,您可以保存经过训练的SVM,以便每次不必重新训练。
svm.save("svm_filename")
svm.load("svm_filename")
要使用训练好的SVM测试您的图像,只需读取图像,将其转换为1D矩阵,然后将其传递给svm.predict()
:
svm.predict(img_mat_1d);
它将基于您设置的标签(例如,根据我之前的眼睛/非眼睛示例,为-1或1)返回一个值。或者,如果您想一次测试多个图像,可以创建一个与先前定义的训练矩阵具有相同格式的矩阵,并将其作为参数传递。但是返回值将不同。
祝你好运!