我正在构建一个机器学习模型,其中一些列是物理地址(我可以将它们翻译成X/Y坐标),但我有点困惑ML算法将如何处理这些数据。是否有特定的方法将地理位置转换为适用于ML分类和/或回归的列?
提前感谢!
提前感谢!
这是我们在评论中得出的答案总结:
将邮政编码转换为地理坐标系,不应视为“分割”,而只应视为以多维方式表示数据的一种方式(在本例中,维数将为2)。 机器学习算法既适用于一维数据,也适用于多维数据。这两个维度可以是相关的或不相关的,具体取决于您在之后选择的模型参数如何定义。
此外,在大多数情况下,关联性不必明确设置。仅一个初始值可能有用,但许多算法还依赖于随机初始化或其他简单方法来从数据子集估计它。因此,为了清晰起见,如果您例如通过高斯模型对数据进行建模,则在估计此高斯分布的参数时,协方差矩阵将具有非零的非对角线项,这些项将表示数据的相关性。您只需要不假设2个维度不相关即可!