假设我们有一家香水店,有100种不同的香水。假设10,000名顾客来到店内,为每种香水评分,评分从一星到五星。问题是:“如何最好地构建一个由5种香水组成的套装,以便95%的顾客会至少为其中一种给出4星或以上的评价?”如何进行算法处理?
注意:我可以看到这个问题本身并没有准确表述;不存在这样的结构的保证。存在两个参数之间的权衡。
另外,(这使得香水类比稍微有些人为),获得一个良好的匹配还是三个良好的匹配并没有关系。所以{4.3,0,0,0,0}等同于{4.3,4.2,4.2,4.2,4.2}--在两种情况下分数都是4.3。
假设为了论证,香水0-19是甜的,香水20-39是酸的等等(相似盐,苦味,鲜味)。因此,0-19之间会有非常高的交叉相关性。
如果你用100个点在空间中建模,那么0-19会非常强烈地互相吸引,它们会形成一个集群。同样,你会得到另外四个集群,表示其他四种味道。
因此,从一个指标中,我们分出了5种不同的口味。但这种技术是否扩展到其他场景呢?
PS:提供相关技术名称将非常有帮助,因为这样可以让我在谷歌上搜索更多信息。因此,任何只是用行业公认术语重新陈述问题的答案都会很有用!
注意:我可以看到这个问题本身并没有准确表述;不存在这样的结构的保证。存在两个参数之间的权衡。
另外,(这使得香水类比稍微有些人为),获得一个良好的匹配还是三个良好的匹配并没有关系。所以{4.3,0,0,0,0}等同于{4.3,4.2,4.2,4.2,4.2}--在两种情况下分数都是4.3。
假设为了论证,香水0-19是甜的,香水20-39是酸的等等(相似盐,苦味,鲜味)。因此,0-19之间会有非常高的交叉相关性。
如果你用100个点在空间中建模,那么0-19会非常强烈地互相吸引,它们会形成一个集群。同样,你会得到另外四个集群,表示其他四种味道。
因此,从一个指标中,我们分出了5种不同的口味。但这种技术是否扩展到其他场景呢?
PS:提供相关技术名称将非常有帮助,因为这样可以让我在谷歌上搜索更多信息。因此,任何只是用行业公认术语重新陈述问题的答案都会很有用!