我有一个NxM的二进制数据集。我对其应用了多种降维技术并绘制了前两个维度。这是我获取是否适用于我的数据集的直觉的方式。是否有更合适/系统化/启发式/正式的方法来测试我使用的降维技术的适用性呢?
我有一个NxM的二进制数据集。我对其应用了多种降维技术并绘制了前两个维度。这是我获取是否适用于我的数据集的直觉的方式。是否有更合适/系统化/启发式/正式的方法来测试我使用的降维技术的适用性呢?
你可以使用SOM技术在二维空间中看到多个维度。还有其他的技术,如果我能记起它们的名字,我会更新答案,但我习惯于使用SOM。
这有助于你进行可视化,但评估应该使用效率计来衡量对于你的降维最重要的是什么(SOM本身可以用作降维技术)。什么是重要的,以最小的损失压缩数据?尽可能地压缩数据?以可见的方式表示数据?你可以通过一个好的函数来测量你的技术有多好,而不需要看到它们如何改变数据空间的表示。