我正在处理一个分类问题,我只有关于一个类的数据,因此我想将其与所有其他可能性即“离群值”类别进行分类。因此,我打算使用单类分类器或LibSVM分类器。但问题是:
我需要为“离群值”类别提供训练数据吗?如果是,是否有任何方法可以解决这个问题,因为我只有关于目标类的数据。
我需要为“离群值”类别提供训练数据吗?如果是,是否有任何方法可以解决这个问题,因为我只有关于目标类的数据。
利用只有正例样本的方法之一是密度估计。您可以将参数模型拟合到数据中(例如,多元正态分布),也可以使用核密度估计器(类似于最近邻的单类版本,具有核化距离度量)。然后,在学习模型下评估新数据的概率,如果足够低,则将其拒绝为该类的成员。