线性模型相对于基于树的模型的主要优势包括: 它们可以进行外推(例如,如果标签在训练集中介于1-5之间,则基于树的模型永远不会预测10,但线性模型会) 由于外推,可用于异常检测 可解释性(是的,基于树的模型具有特征重要性,但它只是一个代理,线性模型中的权重更好) 需要较少的数据即可获得良好的结果 具有强大的在线学习实现(如Vowpal Wabbit),这对于处理具有许多特征的巨大数据集(例如文本)至关重要