如何使用机器学习运行反向预测?

3

我在机器学习方面还比较新,但是我想要解决以下问题。这是一种反向预测的问题。 我有很多输入数据,并相应地为每个记录提供一个输出结果。因此,我可以轻松进行分类并预测未知的新数据的输出结果。 我想要解决的问题是,给定一个期望的结果,如何对一组能够以非常高的概率得到所需的定义输出的输入数据进行分类。

为了让问题更加复杂,我想要灵活地定义一些输入条件,这些条件可能是不可改变的(例如男/女),并添加这些条件作为过滤器,并获得新的反向预测 - 除了给定的条件外,最相关重要的输入是什么,才能得到预期的和定义的输出结果。

让我们举个例子:我有成千上万条学生记录,包括教育等信息以及他们在工作经验10年后是否赚得普通或极高的薪水。因此,如果我是一名新生,我可以根据我的教育、性别、毕业时的年龄、我正在学习什么等因素预测我的收入水平是高还是低。 我的问题是,假设我是男性,毕业时的年龄是给定的,我应该学习什么来有很高的概率赚到极高的薪水呢?

1个回答

0

这个问题没有唯一或最优解,但可以用几种方法来解决。

理解的关键是,从向量输入到标量/分类输出存在信息损失。这不是一个“可逆”的或“可逆转”的转换,因为多个非常不同的输入向量可能导致相同的输出值,从而稀释信息组件。

话虽如此,解决该问题的一个可能角度是对输入向量进行聚类,为每个输出值获取几个相关的聚类。然后,您可以提取这些输入聚类中心并检查导致所需结果的典型值是什么。这样,您就可以得到所需的反向“感兴趣的输入点”。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接