我正在尝试计算此数据集中每列的样本数、均值、标准差、变异系数、下限和上限95%置信区间以及四分位数,并将其放入一个新的数据框中。以下数字不一定全部正确,我没有填写所有数字,只是提供了一个示例。这些值将用于创建箱线图,因此需要四分位数。最终结果将成为行和列的标题。请参见以下示例。
以下是结构:
以下是结构:
B1 <- c(8, 6, 13, 6, 27, 104, 18, 3)
B2 <- c(2, 13, 1, 64, 127, 24, 4, 3)
B3 <- c(8, 16, 113, 680, 227, 310, 138, 30)
B4 <- c(238, 46, 613, 69, 7, 14, 4, 8)
x <- data.frame(B1, B2, B3, B4)
> head(x)
B1 B2 B3 B4
1 8 2 8 238
2 6 13 16 46
3 13 1 113 613
4 6 64 680 69
5 27 127 227 7
6 104 24 310 14
期望的输出:
> y
B1 B2 B3 B4
n 8 8 8 8
mean 23 30 190 125
Stand dev 5 2 34 2
CoeffofVariation 0.3 0.4 0.7 1.3
LowerConfInterval 2 20 35 45
UpperConfInterval 50 120 122 120
LowerQuartile
Median
Upper Quantile
Inter Quartile Range
Minimum
Maximum
Regression equation
sapply
循环遍历数据框。myFunc <- function(x) c(mean=mean(x), n=length(x), median=median(x))
然后sapply(dat, myFunc)
。将其包装在data.frame
中以获取数据框而不是矩阵。 - lmogeom_boxplot
呢?http://ggplot2.tidyverse.org/reference/geom_boxplot.html - r.bot