使用OpenCV和SVM处理图像

64

我在使用OpenCV和SVM进行图像读取、特征提取、训练和测试时遇到了困难。请问有什么好的链接可以指导我吗?我已经查看了OpenCV介绍支持向量机,但它没有帮助我读取图片,也不确定如何将其应用。


我的目标是对图像中的像素进行分类。这些像素属于曲线。我理解如何构造训练矩阵(例如,image A 1,1 1,2 1,3 1,4 1,5 2,1 2,2 2,3 2,4 2,5 3,1 3,2 3,3 3,4 3,5),我会将训练矩阵形成为[3][2]={ {1,1} {1,2} {1,3} {1,4} {1,5} {2,1} ..{} }.

然而,我有点困惑标签的问题。据我理解,我必须指定训练矩阵中哪一行(图像)对应于一个曲线或非曲线。但是,如果一个训练矩阵行(图像)中有一些像素属于曲线,而另一些不属于曲线,那么我该如何标记它呢?例如,我的训练矩阵是[3][2]={ {1,1} {1,2} {1,3} {1,4} {1,5} {2,1} ..{} },像素{1,1}和{1,4}属于曲线,但其他像素不属于。


1
在OpenCV 3.x中,SVM访问程序有些不同。对于寻找它们的人,https://dev59.com/H14d5IYBdhLWcg3wJvwp 这个链接将提供正确的语法,以便正确地遵循@Walfie的答案。 - Saksham Sharma
1个回答

221

最近我也遇到了这个问题,以下是我为了让SVM能够处理图像而采取的方法。

要在一组图像上训练你的SVM,首先你需要构建SVM的训练矩阵。这个矩阵的规格如下:矩阵的每一行对应一个图像,该行中的每个元素都对应于该类别的一个特征--在这种情况下,是某个点的像素颜色。由于你的图像是二维的,所以你需要将它们转换成一个一维矩阵。每行的长度将是图像的面积(注意图像必须是相同大小的)。

假设你想在5张不同的图片上训练SVM,每张图片都是4x3像素。首先,你需要初始化训练矩阵。矩阵的行数将是5,列数将是图像的面积,即4*3 = 12。

int num_files = 5;
int img_area = 4*3;
Mat training_mat(num_files,img_area,CV_32FC1);

理想情况下,num_filesimg_area不应该是硬编码的,而是通过循环遍历目录并计算图像数量以及获取实际图像面积来获得。
下一步是使用每个图像的数据“填充”training_mat的行。以下是如何为一行进行映射的示例。

Convert 2D image matrix to 1D matrix

我已经为图像矩阵中的每个元素分配了一个编号,指示它在训练矩阵中对应行中的位置。例如,如果这是第三张图片,则在训练矩阵中,这将是第三行。
你需要循环遍历每个图像,并相应地设置输出矩阵中的值。以下是多个图像的示例:

Training matrix with multiple images

关于如何在代码中实现这一点,您可以使用reshape(),但是由于矩阵不连续,我遇到了一些问题。根据我的经验,我会做类似于以下的事情:
Mat img_mat = imread(imgname,0); // I used 0 for greyscale
int ii = 0; // Current column in training_mat
for (int i = 0; i<img_mat.rows; i++) {
    for (int j = 0; j < img_mat.cols; j++) {
        training_mat.at<float>(file_num,ii++) = img_mat.at<uchar>(i,j);
    }
}

针对每个训练图像执行此操作(记得递增file_num)。完成后,您应该已经正确设置了训练矩阵以便传入SVM函数。其余步骤与在线示例非常相似。
请注意,在执行此操作时,您还必须为每个训练图像设置标签。例如,如果您基于图像对眼睛和非眼睛进行分类,则需要指定训练矩阵中的哪一行对应于眼睛和非眼睛。这是指定为1D矩阵的,其中1D矩阵中的每个元素对应于2D矩阵中的每一行。为每个类别选择值(例如,非眼睛为-1,眼睛为1)并将其设置在标签矩阵中。
Mat labels(num_files,1,CV_32FC1);

如果在这个labels矩阵中的第三个元素为-1,那么意味着训练矩阵中的第三行属于“非眼”类。您可以在评估每个图像的循环中设置这些值。您可以将训练数据按类别分别排序到不同的目录中,并循环遍历每个目录中的图像,并根据目录设置标签。
接下来要做的是设置SVM参数。这些值将根据您的项目而变化,但基本上您需要声明一个CvSVMParams对象并设置这些值:
CvSVMParams params;
params.svm_type = CvSVM::C_SVC;
params.kernel_type = CvSVM::POLY;
params.gamma = 3;
// ...etc

有许多关于如何设置这些参数的在线示例,比如您在问题中发布的链接。

接下来,您需要创建一个 CvSVM 对象并基于您的数据进行训练!

CvSVM svm;
svm.train(training_mat, labels, Mat(), Mat(), params);

根据数据量的大小,这可能需要很长时间。然而,在训练完成后,您可以保存经过训练的SVM,以便每次不必重新训练。
svm.save("svm_filename"); // saving
svm.load("svm_filename"); // loading

要使用训练好的SVM测试您的图像,只需读取图像,将其转换为1D矩阵,然后将其传递给svm.predict()

svm.predict(img_mat_1d);

它将基于您设置的标签(例如,根据我之前的眼睛/非眼睛示例,为-1或1)返回一个值。或者,如果您想一次测试多个图像,可以创建一个与先前定义的训练矩阵具有相同格式的矩阵,并将其作为参数传递。但是返回值将不同。

祝你好运!


@Walfie 如果我们使用不同的图像,例如您提到的 int img_area = 4*3;,但如果我们每张图片的面积都不同,那么我们该怎么办? - user2335532
1
@Wish_2_fly 矩阵中的每一行都必须具有相同的大小,因此在图像大小不同的情况下,由您的应用程序决定如何处理。个人认为我会选择一些固定的大小,如果图像不适合该大小,则进行上采样/下采样。这可以在输入图像本身上完成,也可以在将它们读入程序以填充矩阵时完成。 - Walfie
@Walfie我们能否使用同样的一行图像调整方法来与surf一起使用? - Rocket
@Angel 我以前没有使用过SURF,但是简要查看了文档后,似乎它使用了不同的输入格式。 - Walfie
2
虽然这是一个非常好的解释,但我必须提到通常您不会对整个图像进行分类,而是针对图像的特征进行分类。例如:从图像中提取HOG并使用它来训练分类器。 - LandonZeKepitelOfGreytBritn
显示剩余8条评论

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接