使用机器学习从图像中计算车辆数量

Question

3

我刚接触机器学习，现在有一个任务需要用机器学习的概念从图像中找到车辆的总数。我使用神经网络来实现这个任务。此处给出了最坏情况的图片。

我的想法是将这张大图切成小的图像块并训练网络计算每个小图像块中车辆的数量，每个图像块中的车辆数都小于5。在处理新图像时，我可以利用滑动窗口来获取所有车辆的总数。

我只是想知道这个想法是否可行，或者我是否应该进行特征提取并用这些特征训练神经网络。如果可行，是否对数据集和训练有任何条件要求？

- arjun subramannian

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Martin Thoma · Accepted Answer

类似但更困难的任务是实例分割。我在这个领域看过的最新论文之一是面向实例级语义标记的像素级编码和深度分层。

在计算机视觉中，实例分割可能是最困难的任务。当您初次接触机器学习/计算机视觉时，您可能首先想进行图像分类。如果您想朝着实例分割的方向发展，则应继续进行语义分割，然后是实例分割。

简单的滑动窗口方法，其中您只预测“汽车”/“非汽车”，将不起作用，因为在图像中，汽车没有被任何“非汽车”分开。