TargetConnectionErrorCount
:在我看来,这是最能对应SurgeQueueLength
的指标,因为它表示负载均衡器试图向后端节点打开连接并失败了。
- HTTPCode_ELB_5XX_Count
:根据后端节点,这可能表明它们拒绝新连接,因为例如他们的最大连接数已达到。
- RejectedConnectionCount
:这是AWS员工在上面链接的主题中建议的。但是...文档说“由于负载均衡器已达到其最大连接数而被拒绝的连接数”,这似乎更像是AWS方面的限制,您不能真正影响它(即它没有在ALB限制中描述)。
- RequestCountPerTarget
:这是后端节点每分钟收到的平均连接数。当您在一段时间内跟踪这个指标时,您可能能够评估出一个“健康门槛”。
- TargetResponseTime
:后端节点需要回答请求的秒数。另一个可以作为“健康门槛”进行评估的候选指标(即“您希望最终用户体验的最大响应时间是多少?”)。ALB的设计不同,没有SurgeQueueLength
或SpillOver
指标。来源:AWS工作人员。