逻辑回归缺失值

3

我能使用有缺失值的逻辑回归吗?

我的数据中有很多连续属性和一些分类属性,我能将它们设置为用户缺失吗?这样做有用吗?

2个回答

2
大多数回归程序需要完整的数据,但是有各种方法来处理缺失值。这是一个微妙的话题,因此我不会在这里假装给出完整的答案,并建议阅读相关主题的一些文章。简而言之:
  1. 永远不要删除观测数据以解决此问题。
  2. 变量的删除始终是允许的,但显然在数据预算方面非常严重。
  3. 应该谨慎地(当缺失比例非常低时)使用全局常量(例如非缺失值的平均值或中位数)填充缺失值,如果使用则应该尽量减少。
  4. 用基于其他独立变量选择的值填充缺失值优于上述第3点。
要了解更多信息,请查阅“插补”、“单次插补”和“多次插补”、“随机缺失”和“完全随机缺失”等术语的信息。

2

进行回归分析需要对每个事件都进行所有变量的测量。也许其他技术可以处理缺失的属性,但回归分析不行。

顺便说一下,你应该尝试在 https://stats.stackexchange.com/ 上发布问题。

希望能帮到你!


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接