我理解神经网络的工作原理,但如果我想将它们用于像实际字符识别这样的图像处理中,我不知道如何将图像数据输入神经网络。
我有一张非常大的“A
”字母图片。也许我应该尝试从图像中获取一些信息/规格,然后使用该规格的值向量?这些值将成为神经网络的输入?
已经做过这种事情的人,可以解释如何做吗?
我理解神经网络的工作原理,但如果我想将它们用于像实际字符识别这样的图像处理中,我不知道如何将图像数据输入神经网络。
我有一张非常大的“A
”字母图片。也许我应该尝试从图像中获取一些信息/规格,然后使用该规格的值向量?这些值将成为神经网络的输入?
已经做过这种事情的人,可以解释如何做吗?
所有关于将NN应用于图像的考虑都在我们的2002年综述论文中涵盖(基于特征、基于像素、尺度不变性等)。
你面临的最大挑战是所谓的“维度灾难”。
我会将NN的表现与支持向量机进行比较(使用哪些核函数很棘手)。
您可以使用实际像素作为输入。这就是为什么有时候使用较小分辨率的输入图像更可取的原因。
人工神经网络的好处在于它们能够进行特征选择(通过为那些输入节点分配接近零的权重来忽略非重要像素)。