自动植物检测图像技术

4
我的图像数据集来自http://www.image-net.org。有各种不同的synset,如植物、动物、人等。
我必须训练一个分类器,如果图像属于植物synset,则预测为1,否则为0。
属于植物synset的图像可以通过在左窗格中点击植物、植物生命选项,在http://www.image-net.org/explore上查看。

这些图像包括各种各样的植物-如树木、草本植物、灌木、花卉等。 我无法确定用于训练分类器的特征。这些图像中有很多绿色的部分,但是有许多花朵图像没有太多绿色成分。另一个特征是叶子和花瓣的形状。

如果有人能建议如何提取这个形状特征并将其用于训练分类器,那将非常有帮助。还建议使用哪些其他特征来训练分类器。
提取特征后,应使用哪个算法来训练分类器?

2
应该迁移到dsp.stackexchange.com。 - Andrey Rubshtein
2个回答

4
我不确定形状信息是否适用于您链接的数据集。通过一些图像的快速浏览,我有一些分类建议:
1.自然场景很少有直线-线检测。 2. 可以排除具有大量“不自然”颜色的场景。 3.如果您想尝试更高级的内容,我建议熵/模式识别之间的混合将形成一个很好的分类器,因为自然场景这两个都有很多。 4.尝试使用模板匹配/形状匹配来匹配叶子/花瓣会让你心碎-你需要使用更通用的东西。
至于要使用哪种分类器...我通常建议最初使用K-means,然后确定实现贝叶斯或神经网络所需的额外工作是否值得。
希望能对你有所帮助。
T.
扩展: "不自然的颜色"可能是高度饱和的颜色,超出了绿色和棕色的范围。它们适用于检测自然场景,即使花朵位于其中心,该场景中也应该有约50%的绿/棕光谱。此外,自然场景中直线检测应该产生很少结果,因为直边在自然界中很少见。在基本级别上,生成边缘图像,对其进行阈值处理,然后搜索线段(逼近直线的像素)。熵需要一些机器视觉知识。您将通过确定局部熵然后制作直方图来处理场景,这是一个类似的方法,您必须使用此处。如果您要尝试模式识别,则需要在机器视觉方面进行更高级的操作,因为这是一个困难的主题,不是您可以在代码示例中轻松完成的东西。仅在颜色和边缘信息(线)耗尽后,我才会尝试将它们实施为分类器。如果这是商业应用程序,则应咨询MV专家。如果这是大学作业(除非是论文),否则颜色和边缘/线信息应该足够。

安德烈是正确的。数字信号处理堆栈是这类问题的热门讨论区。 - Totero
如何检测“不自然的颜色”?如何开始熵/模式识别?给定一张新图片,分类器应该能够检测出图像中是否有任何花卉内容。 - gourav
这是一个大学项目。谢谢。我正在探索熵/模式识别。如果您知道一些好的资源来开始熵/模式识别,请发布它们。 - gourav
如果您能够使用OpenCV,http://blog.damiles.com/category/tutorials/opencv-tutorials/提供了一些很好的示例。不过,在尝试实现它之前,您需要在教科书中阅读有关模式识别的内容。 - Totero

0

HOOG的特征在这类问题中几乎是事实标准,我认为。它们计算起来有点复杂(而且我不知道你在什么环境中工作),但非常强大。

一个更简单的解决方案,取决于数据集的难度,是从图像中提取所有重叠的补丁,使用k-means(或您喜欢的任何算法)对其进行聚类,然后将图像表示为这组量化图像补丁的分布,用于监督分类器,如SVM。你会惊讶地发现,像这样的东西经常奏效,并且至少应该提供一个有竞争力的基准。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接