我一直在作为业余项目学习神经网络,但是对于如何处理分类数据感到完全不知所措。我阅读了这篇文章:http://visualstudiomagazine.com/articles/2013/07/01/neural-network-data-normalization-and-encoding.aspx,其中解释了输入数据的归一化,并说明了如何使用效果编码对分类数据进行预处理。我理解将类别分成向量的概念,但不知道如何实际实现。
例如,如果我使用国家作为分类数据(例如芬兰,泰国等),那么我会将生成的向量处理成单个数字以馈送到单个输入中,还是每个向量组件都有一个单独的输入?后者的情况下,如果有196个不同的国家,那么这意味着我需要196个不同的输入来处理这个特定的数据部分。如果大量不同的分类数据被馈送到网络中,我可以看到这很快会变得非常难以管理。
我是否遗漏了什么?分类数据如何映射到神经元输入?