我是一名新手人工智能。我了解K最近邻算法以及如何实现它。然而,如果要计算不在一个比例尺上的事物的距离或权重,该怎么办?
例如,年龄距离可以很容易地计算,但是你如何计算红色到蓝色的距离?也许颜色是个糟糕的例子,因为你仍然可以使用频率。比如说汉堡、披萨和薯条之间的距离怎么办?
我有一种感觉,这里肯定有聪明的方法。
非常感谢您的关注和帮助。
编辑:非常感谢大家提供的非常好的答案。这真的很有帮助,我很感激。但我认为肯定有出路。
我能不能这样做?假设我正在使用我的KNN算法来预测一个人是否会在我餐厅用餐,该餐厅供应上述三种食品中的所有食品。当然,还有其他因素,但为了简单起见,在喜爱的食物领域中,300个人中有150个喜欢汉堡,100个喜欢披萨,50个喜欢薯条。常识告诉我,喜欢的食物会影响人们是否决定用餐。
所以现在一个人输入他/她最喜欢的食物是汉堡,我要预测他/她是否会在我的餐厅用餐。忽略其他因素,并基于我的(训练)先前知识库,常识告诉我,对于这个特定领域的最近邻居距离,与如果他输入披萨或薯条相比,更有可能存在更近的距离。
唯一的问题是我使用了概率,我可能是错误的,因为我不知道并且可能无法计算实际距离。我还担心这个字段会对我的预测产生过多/过少的权重,因为距离可能与其他因素(价格、时间、餐厅是否已满等我可以轻松量化的因素)不成比例,但我想我可以通过一些参数调整来解决这个问题。
哦,每个人都提供了很好的答案,但我只能接受一个。在这种情况下,我将在明天接受得票最高的答案。再次感谢大家。
例如,年龄距离可以很容易地计算,但是你如何计算红色到蓝色的距离?也许颜色是个糟糕的例子,因为你仍然可以使用频率。比如说汉堡、披萨和薯条之间的距离怎么办?
我有一种感觉,这里肯定有聪明的方法。
非常感谢您的关注和帮助。
编辑:非常感谢大家提供的非常好的答案。这真的很有帮助,我很感激。但我认为肯定有出路。
我能不能这样做?假设我正在使用我的KNN算法来预测一个人是否会在我餐厅用餐,该餐厅供应上述三种食品中的所有食品。当然,还有其他因素,但为了简单起见,在喜爱的食物领域中,300个人中有150个喜欢汉堡,100个喜欢披萨,50个喜欢薯条。常识告诉我,喜欢的食物会影响人们是否决定用餐。
所以现在一个人输入他/她最喜欢的食物是汉堡,我要预测他/她是否会在我的餐厅用餐。忽略其他因素,并基于我的(训练)先前知识库,常识告诉我,对于这个特定领域的最近邻居距离,与如果他输入披萨或薯条相比,更有可能存在更近的距离。
唯一的问题是我使用了概率,我可能是错误的,因为我不知道并且可能无法计算实际距离。我还担心这个字段会对我的预测产生过多/过少的权重,因为距离可能与其他因素(价格、时间、餐厅是否已满等我可以轻松量化的因素)不成比例,但我想我可以通过一些参数调整来解决这个问题。
哦,每个人都提供了很好的答案,但我只能接受一个。在这种情况下,我将在明天接受得票最高的答案。再次感谢大家。