我将从3个大型数据表(命名为A1、A2、A3)开始。每个表都有4列数据(V1-V4),一个“日期”列跨越所有三个表,以及数千行数据。
这里是一些模拟我的表的虚拟数据。
所以这就是我的数据框最终的样子:
所以我的问题是,如何根据列名的部分匹配计算行平均值?
谢谢。
这里是一些模拟我的表的虚拟数据。
A1.V1<-c(1,2,3,4)
A1.V2<-c(2,4,6,8)
A1.V3<-c(1,3,5,7)
A1.V4<-c(1,2,3,4)
A2.V1<-c(1,2,3,4)
A2.V2<-c(2,4,6,8)
A2.V3<-c(1,3,5,7)
A2.V4<-c(1,2,3,4)
A3.V1<-c(1,2,3,4)
A3.V2<-c(2,4,6,8)
A3.V3<-c(1,3,5,7)
A3.V4<-c(1,2,3,4)
Date<-c(2001,2002,2003,2004)
DF<-data.frame(Date, A1.V1,A1.V2,A1.V3,A1.V4,A2.V1,A2.V2,A2.V3,A2.V4,A3.V1,A3.V2,A3.V3,A3.V4)
所以这就是我的数据框最终的样子:
Date A1.V1 A1.V2 A1.V3 A1.V4 A2.V1 A2.V2 A2.V3 A2.V4 A3.V1 A3.V2 A3.V3 A3.V4
1 2001 1 2 1 1 1 2 1 1 1 2 1 1
2 2002 2 4 3 2 2 4 3 2 2 4 3 2
3 2003 3 6 5 3 3 6 5 3 3 6 5 3
4 2004 4 8 7 4 4 8 7 4 4 8 7 4
我的目标是计算每个数据表中匹配列的行均值。因此,在这种情况下,我希望得到所有以V1结尾的列、所有以V2结尾的列、所有以V3结尾的列和所有以V4结尾的列的行均值。
最终结果应该像这样:
V1 V2 V3 V4
2001 1 2 1 1
2002 2 4 3 2
2003 3 6 5 3
2004 4 8 7 4
所以我的问题是,如何根据列名的部分匹配计算行平均值?
谢谢。