深度学习用于图像分类

19

阅读了一些深度学习和深信网络的论文后,我对它的工作原理有了基本的了解。但是最后一步仍然卡在分类步骤上。我在互联网上找到的大部分实现都涉及生成(MNIST数字)。

是否有一些说明(或代码)可用于使用DBN分类图像(最好是自然图像或对象)的地方?

此外,指向方向的一些指针将非常有帮助。


请查看Cross Validated上的这个回答:http://stats.stackexchange.com/a/41201/14673 - Def_Os
这个问题属于交叉验证 http://stats.stackexchange.com/questions/41029/restricted-boltzmann-machines-for-regression/41201#41201 - lejlot
3个回答

24
基本思路 现今,图像分类问题(如ImageNet)的深度学习最先进技术通常使用“深度卷积神经网络”(Deep ConvNets)。它们大致长这个样子,这是由Krizhevsky et al提出的ConvNet配置: enter image description here 推断(分类)中,将一张图像输入到左侧(注意左侧的深度为3,表示RGB),通过一系列卷积滤波器进行计算,然后输出右侧的一个1000维向量。该图片特别针对ImageNet,专注于对1000类图像进行分类,因此1000d向量是“该图像属于该类别的可能性得分”。
训练神经网络只比较复杂。在训练过程中,您基本上会重复运行分类,并定期进行反向传播(请参阅Andrew Ng的讲座),以改进网络中的卷积滤波器。基本上,反向传播会询问“网络正确/错误地分类了什么?对于错误分类的内容,让我们稍微调整一下网络。”

实现

Caffe是深度卷积神经网络非常快的开源实现(比Krizhevsky等人的cuda-convnet更快)。Caffe代码相当容易阅读;基本上每种类型的网络层(例如卷积层、最大池化层等)都有一个C++文件。


2

现在人们开始在分类层中使用SVM。

深度学习正在自由和广泛地发展。


2

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接