我正在通过Kubernetes集群提供jupyter笔记本服务。 我已经设置了resources.limits
,以防止有人耗尽主机服务器的内存。
一个问题是,在容器超过内存限制后,jupyter笔记本核心程序可能会崩溃并自动重启,但不会抛出任何OOM(Out of Memory)错误,这将使用户非常困惑。
那么,我如何在Kubernetes上运行jupyter笔记本时触发OOM错误呢?
我正在通过Kubernetes集群提供jupyter笔记本服务。 我已经设置了resources.limits
,以防止有人耗尽主机服务器的内存。
一个问题是,在容器超过内存限制后,jupyter笔记本核心程序可能会崩溃并自动重启,但不会抛出任何OOM(Out of Memory)错误,这将使用户非常困惑。
那么,我如何在Kubernetes上运行jupyter笔记本时触发OOM错误呢?
kubectl get events --watch
kubectl logs -f podname
话虽如此,但并非所有Pod生命周期中的事件都能得到正确的报告,正如kubernetes/kubernetes
问题38532和(已废弃的)PR 45682所示。
但是,在docker inspect
查看Pod时,您仍应该看到OOMKilled:true
。