使用Prometheus测量服务延迟

17

我对Prometheus和Grafana还很陌生。我的主要目标是获取每个请求的响应时间。

对我来说,这似乎是一件简单的事情 - 但无论我做什么,都无法得到我需要的结果。

我需要能够分析最近几分钟/小时/天内的服务延迟。我找到的当前实现是一个简单的SUMMARY(没有定义分位数),每15秒进行一次抓取。

  1. 是否可以从我的Prometheus SUMMARY中获取最近一分钟的平均请求延迟?
  2. 如果可以:如何操作?如果不行:我该怎么办?

目前我正在使用以下查询:

rate(http_response_time_sum{application="myapp",handler="myHandler", status="200"}[1m])
/
rate(http_response_time_count{application="myapp",handler="myHandler", status="200"}[1m])

我得到了两个“数据集”。第一个的值是“NaN”。我想这可能是由于除以零导致的结果。

(我正在使用spring-client。)

1个回答

13

您的查询是正确的。如果在过去一分钟内没有任何查询,结果将为 NaN。


谢谢!这意味着计算出的值会得到更高的权重;-) - eventhorizon

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接