我有一个数据集,需要能够控制异常检测模型(孤立森林、椭圆包络、OneClassSVM等)将给定点视为异常值的程度(类似于Z-score或IQR-score)。这意味着我不想事先指定数据集中异常点的百分比,也就是所谓的
这是 Sci-kit Learn 包对此的说明:“如果设置为 'auto',则阈值的确定方式与原始论文相同。”
这个“原始论文”的是指哪篇?将
contamination
参数,而是希望这个百分比取决于我想让模型多么严格。这和将参数 contamination
设置为 'auto' 是否相同?这是 Sci-kit Learn 包对此的说明:“如果设置为 'auto',则阈值的确定方式与原始论文相同。”
这个“原始论文”的是指哪篇?将
contamination
参数设置为 'auto' 能解决我的问题吗?