深度学习用于图像分类

Question

19

阅读了一些深度学习和深信网络的论文后，我对它的工作原理有了基本的了解。但是最后一步仍然卡在分类步骤上。我在互联网上找到的大部分实现都涉及生成（MNIST数字）。

是否有一些说明（或代码）可用于使用DBN分类图像（最好是自然图像或对象）的地方？

此外，指向方向的一些指针将非常有帮助。

- Nihar Sarangi

请查看Cross Validated上的这个回答：http://stats.stackexchange.com/a/41201/14673 - Def_Os

这个问题属于交叉验证 http://stats.stackexchange.com/questions/41029/restricted-boltzmann-machines-for-regression/41201#41201 - lejlot

3个回答

2

现在人们开始在分类层中使用SVM。

深度学习正在自由和广泛地发展。

- LazyLearner

2

你应该在已用于生成的网络顶部使用一个softmax层（http://en.wikipedia.org/wiki/Softmax_activation_function），并使用反向传播来微调最终的网络。

- elaRosca

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- solvingPuzzles · Accepted Answer

基本思路 现今，图像分类问题（如ImageNet）的深度学习最先进技术通常使用“深度卷积神经网络”（Deep ConvNets）。它们大致长这个样子，这是由Krizhevsky et al提出的ConvNet配置： enter image description here

推断（分类）中，将一张图像输入到左侧（注意左侧的深度为3，表示RGB），通过一系列卷积滤波器进行计算，然后输出右侧的一个1000维向量。该图片特别针对ImageNet，专注于对1000类图像进行分类，因此1000d向量是“该图像属于该类别的可能性得分”。

训练神经网络只比较复杂。在训练过程中，您基本上会重复运行分类，并定期进行反向传播（请参阅Andrew Ng的讲座），以改进网络中的卷积滤波器。基本上，反向传播会询问“网络正确/错误地分类了什么？对于错误分类的内容，让我们稍微调整一下网络。”

实现

Caffe是深度卷积神经网络非常快的开源实现（比Krizhevsky等人的cuda-convnet更快）。Caffe代码相当容易阅读；基本上每种类型的网络层（例如卷积层、最大池化层等）都有一个C++文件。