R实现的boosted regression trees(包gbm)默认如何处理预测变量的缺失值?它们是否被填充,如果是,使用哪种算法进行填充?
问题背景:我在近一年前进行了分析,并使用Elith等人提供的脚本来调用gbm。我现在意识到某些预测变量存在缺失值,我想知道增强回归树是如何处理这些值的。浏览了各种手册和论文后,我发现有关“增强回归树可以适应缺失值”之类的表述,但我找不到关于gbm如何处理缺失值的精确描述。分析本身运行没有问题,因此gbm肯定以某种方式处理了它们。在gbm手册中,甚至有一个示例,在其中故意引入NAs,以证明gbm在没有问题的情况下继续工作。现在我想知道gbm究竟如何处理NAs(跳过它们,填充它们...?)。
问题背景:我在近一年前进行了分析,并使用Elith等人提供的脚本来调用gbm。我现在意识到某些预测变量存在缺失值,我想知道增强回归树是如何处理这些值的。浏览了各种手册和论文后,我发现有关“增强回归树可以适应缺失值”之类的表述,但我找不到关于gbm如何处理缺失值的精确描述。分析本身运行没有问题,因此gbm肯定以某种方式处理了它们。在gbm手册中,甚至有一个示例,在其中故意引入NAs,以证明gbm在没有问题的情况下继续工作。现在我想知道gbm究竟如何处理NAs(跳过它们,填充它们...?)。