我目前正在重新审视使用R语言进行的随机森林项目,以:
有什么线索可以实现这一点吗?任何帮助都将不胜感激,我将确保将其回馈给更大的社区。我知道还有很多其他的R转Python的人会从这种信息中受益。
提前感谢,如果这是我简单地忽略了的简单解决方案,请原谅。
- 使用无监督的随机森林生成数据输入的相似度矩阵
- 从这个相似度矩阵计算距离矩阵,并传递给Partitioning Around Medoids(PAM)聚类算法
- 使用通过PAM获得的聚类,在监督模式下运行随机森林以训练新模型。
- 使用该模型预测来自未来时间点的另一个数据集。
有什么线索可以实现这一点吗?任何帮助都将不胜感激,我将确保将其回馈给更大的社区。我知道还有很多其他的R转Python的人会从这种信息中受益。
提前感谢,如果这是我简单地忽略了的简单解决方案,请原谅。