计算机视觉数据集

8
我正在测试计算机视觉算法以进行图像分类。我想找到一个包含几个对象类别(例如猫和狗)的数据集。该数据集应该具有每个类别内所有变异性都是由类别本身固有的变异性引起的。也就是说,我不想担心来自不同视角或在不同照明条件下拍摄的图片等问题。几乎所有类别内的变异性都应由该类别的固有变异性引起,例如猫的类别将包含许多不同的图像,因为实际上猫看起来彼此不同,而不是因为这些图像是在不同条件下产生的。
最好,对象将被“剪切”(在统一的背景上)。数据集的大小并不重要。合成图像(可能使用3D图形软件生成)也可以。这些图像需要标记其类别。
有人知道这样的数据集吗?
7个回答

6

这是另一个数据集合集 http://riemenschneider.hayko.at/vision/dataset/ - Jumabek Alikhanov

5

5

我熟悉caltech101。像caltech 101和256这样的数据集的目的是相似的,但不同于我正在寻找的内容。在caltech 101中,对象大多是相同大小并且位于图像中心,但这并没有得到很好的控制(这并不是重点)。我特别感兴趣的是一个数据集,其中所有对象都被归一化到相同的视图,并最好在灰色背景上剪裁。这意味着我正在寻找一个非常“简单”的数据集... - innocuousQualia
Caltech很简单,MSR颜色也很简单。请参阅此链接(http://people.csail.mit.edu/torralba/publications/datasets_cvpr11.pdf) - bendervader

3
我列出了我在博士期间正在处理的一些图像数据集 - 但是你应该可以在网络上找到很多。从你的描述中,你正在寻找一个带有groundtruth的对象识别任务或分割数据集。 ALOI数据集可能对您有兴趣: “ALOI是一组用于科学目的记录的一千个小物体的彩色图像集合。为了捕捉对象录制中的感官变化,我们系统地改变了每个对象的视角、照明角度和照明颜色,并额外捕获了宽基线立体图像。我们记录了每个对象的一百多张图片,总共得到了110,250张图片。” 交通标志识别数据集对您也可能有兴趣。如果我没记错的话,交通标志还有地面真实分割掩模。
在任何情况下,您都应该能够将背景替换为您想要的任何内容(如果您想使任务更加复杂)。
祝你在识别任务中好运(如果仍然相关)。

2

我认为CIFAR数据集可能会对您有所帮助。该数据集包含80亿个小图像的标记子集。通过提供的方式,可以在Python、Matlab或C(二进制版本)上轻松加载数据集。


CIFAR和Caltech256无法正常工作的原因相同。我真的需要标准化的图像,例如大小相同、面向相同方向、光照相同等的猫和狗的剪影。不管怎样,还是谢谢。 - innocuousQualia

1
换句话说,我不想担心来自不同视角或在不同光照条件下拍摄的图片等。一个类别内的几乎所有变异性都应该归因于该类别的内在变异性,例如猫的类别将包含许多不同的图像,因为猫实际上看起来互不相同,而不是因为这些图像是在不同的条件下产生的。
这并不是非常现实。事实上,你最终会得到一个根本无法在实践中工作的系统,或者只能在非常受限制的环境中使用。
我知道其中一个数据集(我不关心这些数据集)是UIUC汽车数据集。该数据库包含用于评估目标检测算法的侧面汽车图像(单尺度+多尺度)。

0

尝试使用PASCAL、ImageNet和SUN。Caltech和MSRC已经过时了。

您可能还想阅读这篇论文:Unbiased Look at Dataset Bias - Torralba(MIT) & Efros (CMU):people.csail.mit.edu/torralba/publications/datasets_cvpr11.pdf‎


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接