我在使用一个应用程序时遇到了一些内存问题,但是很难确定具体是哪里出了问题。我有两组数据:
页面浏览量
- 请求的页面
- 请求该页面的时间
内存使用情况
- 正在使用的内存量
- 记录此内存使用情况的时间
我想确切地知道哪些页面浏览量与高内存使用率相关。我的猜测是,我将进行某种T检验,以确定哪些页面浏览量与增加的内存使用率相关。然而,我对要选择哪种类型的T检验还有点不确定。请问有人能至少指点我一下方向吗?
我在使用一个应用程序时遇到了一些内存问题,但是很难确定具体是哪里出了问题。我有两组数据:
页面浏览量
内存使用情况
我想确切地知道哪些页面浏览量与高内存使用率相关。我的猜测是,我将进行某种T检验,以确定哪些页面浏览量与增加的内存使用率相关。然而,我对要选择哪种类型的T检验还有点不确定。请问有人能至少指点我一下方向吗?
杰森,
你提出了很好的统计问题。考虑将内存使用量作为随机变量。第一步是查看此随机变量的分布。它可能不适合任何已知分布,但不要让这停止我们。一个简单的方法是取最高的内存使用量(前5-10%),并查看那些页面浏览量(或请求时刻)是否与其余页面浏览量有所不同。我认为您需要一些非参数测试,以比较低内存样本的页面浏览比例与高内存样本中页面浏览比例。希望这可以帮助到您。
Wilcoxon Signed Ranks Test
,它是一种用于配对样本的Mann-Whitney Test
的变体。它还考虑了每对中差异的大小,其他测试忽略了这一点(例如符号检验)。这是在R语言中实现威尔科克森符号秩检验的过程。