在我们的Kubernetes集群中,我们遇到了节点内存不足且Linux调用OOM killer的零星情况。查看日志,似乎调度到该节点上的Pod正在请求比节点可分配的更多的内存。
问题在于,当触发OOM killer时,它会打印出进程和它们的内存使用情况列表。然而,由于我们所有的Docker容器都是Java服务,所以"进程名称"只显示为"java",无法让我们追踪导致问题的特定Pod。
如何获取在特定节点上运行的哪些Pod以及何时运行的历史记录?
问题在于,当触发OOM killer时,它会打印出进程和它们的内存使用情况列表。然而,由于我们所有的Docker容器都是Java服务,所以"进程名称"只显示为"java",无法让我们追踪导致问题的特定Pod。
如何获取在特定节点上运行的哪些Pod以及何时运行的历史记录?
kubectl get events
,了解在不同节点上创建/删除各个 Pod 的情况。 - Anirudh Ramanathan