神经网络需要有正态分布的数据吗?

8
因此,对于数据的标准化和规范化是一种常见的做法,以使数据呈正态分布,均值为0,标准差为1,对吧?但是,如果数据不是正态分布怎么办?
另外,期望输出结果也必须是正态分布吗?如果我想让我的前馈网络在两个类别(-1和1)之间进行分类,那么将无法将其标准化为均值为0,标准差为1的正态分布,对吧?
前馈网络是非参数的,对吗?那么,如果是这样,标准化数据是否仍然很重要?为什么人们要标准化它?

1个回答

15
标准化特征不是为了使数据符合正态分布,而是将特征值放在已知范围内,使算法更容易从数据中学习。这是因为大多数算法不是尺度/平移不变的。例如,决策树既是尺度又是平移不变的,因此对树的性能没有影响。
问:所以期望输出也必须服从正态分布吗?
答:不,没有这种事情。输出是任何输出都可以的。您确实需要确保网络的最后一层的激活函数能够生成所需的预测(例如:Sigmoid激活函数无法输出负值或大于1的值)。
问:前馈网络是非参数的,对吧?
答:不,它们通常被认为是参数的。参数/非参数并没有严格的定义。人们在讨论这个问题时可能会有稍微不同的意思。
问:那么,如果是参数,标准化数据仍然很重要吗?
答:这些事情完全没有相互关系。
问:为什么人们要将数据标准化?
答:这是我提到的第一件事,目的是使学习更容易/可能。

谢谢您的回复。关于您提到的标准化使用,以确保输入落在特定范围内。但是我读过一些人使用标准化来确保输入/输出具有均值为0和均匀方差(即使它们已经落在某个范围内)。为什么呢? - Luis Cruz
1
我刚刚回答了为什么。这是为了使优化/学习更容易。或者将输出放在激活函数实际可达到的范围内。 - Raff.Edward

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接