我有一个数据框,包含大约50,000行分布在15个不同的ID中(每个ID都有数千条观测记录)。数据框看起来像这样:
ID Year Temp ph
1 P1 1996 11.3 6.80
2 P1 1996 9.7 6.90
3 P1 1997 9.8 7.10
...
2000 P2 1997 10.5 6.90
2001 P2 1997 9.9 7.00
2002 P2 1997 10.0 6.93
我想对每个ID随机选择500行(例如,对于P1选取500行,对于P2再选取500行……)并创建一个新的数据框。我尝试了以下代码:
new_df<-df[df$ID %in% sample(unique(dfID),500),]
但是它只随机获取一个ID,而我需要每个ID随机获取500行。