如何在Julia上进行多重插补?

3

我找到了Impute.jl软件包,但它只能使用这些简单的方法:

  • drop:删除缺失值。
  • locf:向前填充最后一个观测值
  • nocb:向后填充下一个观测值
  • interp:线性插值向量中的值
  • fill:用特定值或函数替换...

似乎没有任何高级的“多重插补”方法。
当我有多个变量时,如何使用更高级的方法?
例如:完全条件规范(mice),贝叶斯方法,随机森林,多层次,嵌套插补,被审查数据,分类数据,生存数据...

我的意思不是创建自己的代码,而是找到任何能够自动执行此操作的Julia软件包。其他软件都有这个功能(R,Python,Stata,SAS…)。

1个回答

1
查看{{link1:BetaML的填补模块}}。
它包括使用高斯混合模型、随机森林或任何其他具有fit!/predict接口的机器学习模型对表格数据进行填补。
它可以对多列进行填补,可选择进行多次填补和多次“通过”数据集进行填补。
(免责声明:我是作者...)

太好了,谢谢你。 - skan

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接