使用机器学习从图像中计算车辆数量

3
我刚接触机器学习,现在有一个任务需要用机器学习的概念从图像中找到车辆的总数。我使用神经网络来实现这个任务。此处给出了最坏情况的图片。

交通图像

我的想法是将这张大图切成小的图像块并训练网络计算每个小图像块中车辆的数量,每个图像块中的车辆数都小于5。在处理新图像时,我可以利用滑动窗口来获取所有车辆的总数。
我只是想知道这个想法是否可行,或者我是否应该进行特征提取并用这些特征训练神经网络。如果可行,是否对数据集和训练有任何条件要求?
1个回答

6
您所寻找的是称为对象检测的内容。起点可以是用于对象检测的深度神经网络基于区域的卷积网络,用于准确的对象检测和分割
类似但更困难的任务是实例分割。我在这个领域看过的最新论文之一是面向实例级语义标记的像素级编码和深度分层
在计算机视觉中,实例分割可能是最困难的任务。当您初次接触机器学习/计算机视觉时,您可能首先想进行图像分类。如果您想朝着实例分割的方向发展,则应继续进行语义分割,然后是实例分割。
简单的滑动窗口方法,其中您只预测“汽车”/“非汽车”,将不起作用,因为在图像中,汽车没有被任何“非汽车”分开。

谢谢Martin...但是如果我们使用滑动窗口,它只能从一个区域识别单个车辆,对吧?我需要计算图像中汽车的总数。这就是为什么我认为训练一个带有图像和其数量的网络会很好。此外,我认为滑动窗口方法需要花费大量时间来处理图像。(我还没有阅读这些内容,我会阅读并感谢你发送)。 - arjun subramannian
使用滑动窗口方法处理图像所需的时间非常取决于步幅、窗口大小和网络复杂度。使用小型网络/大步幅,可以在不到30毫秒的时间内处理一个1400px x 600px的图像。 - Martin Thoma
好的马丁,谢谢你的帮助。但我只是想知道,一个使用图像补丁和相应车辆编号进行训练的网络是否能够直接从测试补丁中预测车辆数量? - arjun subramannian
@arjunsubramannian 这可能会起作用。肯定不会很好,但是它可能还可以。试一试吧。 - Martin Thoma
谢谢Martin...我会尝试两种方法。所有的回答都对我帮助很大,让我能够继续我的工作。 - arjun subramannian

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接