大多数回归程序需要完整的数据,但是有各种方法来处理缺失值。这是一个微妙的话题,因此我不会在这里假装给出完整的答案,并建议阅读相关主题的一些文章。简而言之: 永远不要删除观测数据以解决此问题。 变量的删除始终是允许的,但显然在数据预算方面非常严重。 应该谨慎地(当缺失比例非常低时)使用全局常量(例如非缺失值的平均值或中位数)填充缺失值,如果使用则应该尽量减少。 用基于其他独立变量选择的值填充缺失值优于上述第3点。 要了解更多信息,请查阅“插补”、“单次插补”和“多次插补”、“随机缺失”和“完全随机缺失”等术语的信息。
进行回归分析需要对每个事件都进行所有变量的测量。也许其他技术可以处理缺失的属性,但回归分析不行。 顺便说一下,你应该尝试在 https://stats.stackexchange.com/ 上发布问题。 希望能帮到你!