我正在使用R中的ChickWeight
数据集进行工作。 我想为每只小鸡创建多个模型,每个模型都是针对单个小鸡进行训练的。因此,我正在将数据嵌套以便为每个小鸡创建一个数据框,并将其存储在列表列中。
以下是开始:
library(tidyverse)
library(datasets)
data("ChickWeight")
ChickWeightNest <- ChickWeight %>%
group_by(Chick) %>%
nest()
从这里开始,同时在所有数据帧上训练线性回归模型非常容易,只需构建该模型作为函数,然后变异一个新列并映射即可。但是,构建更复杂的模型(例如xgboost)需要首先将数据分成测试集和训练集。我该如何一次将所有嵌套的数据框拆分为训练集和测试集,以便可以同时训练多个模型?
顺便说一下,我在研究中发现训练/调整多个模型的信息似乎相对稀少,非常感谢任何相关资源或过去的堆栈问题。