在 Kubernetes 中，Pod 是最小的部署单元，用于运行容器化的应用程序。Pod 的状态反映了其当前的运行情况。以下是 Pod 的常见状态及其含义：

1. Pending

含义：

Pod 已被 Kubernetes 系统接受，但尚未创建容器。这通常是因为镜像正在下载，或者调度器正在寻找合适的节点来放置 Pod。

常见原因：

镜像拉取失败（如镜像不存在或网络问题）。
资源不足（如节点没有足够的 CPU 或内存）。
Pod 的调度策略未满足（如亲和性或反亲和性规则）。

解决方法：

检查镜像名称和版本是否正确。
检查节点资源是否充足：kubectl describe node。
查看调度器的日志以确定问题。

2. Running

含义：

Pod 已被调度到节点上，并且所有容器都已成功启动。

常见原因：

Pod 正常运行。

解决方法：

如果 Pod 有多个容器，可以通过 kubectl describe pod检查每个容器的状态。
确保应用程序正常运行，没有内部错误。

3. Succeeded

含义：

Pod 中的所有容器都已成功运行完成，并且不会再重新启动。这通常用于一次性任务（如初始化任务或批处理作业）。

常见原因：

容器正常退出，退出代码为 0。

解决方法：

如果需要保留 Pod 的状态，可以将其保留一段时间，以便查看日志。
如果 Pod 是由 Job 控制器创建的，Job 会自动清理已完成的 Pod。

4. Failed

含义：

Pod 中的所有容器都已终止运行，并且至少有一个容器以失败状态退出（退出代码非 0）。

常见原因：

容器内部的程序崩溃。
容器启动失败（如配置错误或依赖服务不可用）。
容器的健康检查失败。

解决方法：

查看 Pod 的日志，了解失败原因：

kubectl logs

检查 Pod 的事件信息：

kubectl describe pod

根据日志和事件信息排查问题。

5. Unknown

含义

Kubernetes 无法确定 Pod 的状态，通常是因为与 Pod 所在节点的通信失败。

常见原因：

节点网络问题。
节点故障（如节点宕机）。
节点上的 kubelet 服务异常。

解决方法：

检查节点的状态：

kubectl get nodes

查看节点的事件信息：

kubectl describe node

如果节点不可用，可以考虑将 Pod 重新调度到其他节点。

6. Terminating

含义

Pod 正在被删除，但尚未完全终止。Kubernetes 会等待 Pod 中的所有容器正常退出，或者超时后强制终止。

常见原因

用户手动删除 Pod。
Pod 所属的控制器（如 Deployment 或 StatefulSet）决定删除 Pod。

解决方法：

如果 Pod 需要快速终止，可以设置删除超时时间：

kubectl delete pod --force --grace-period=0

查看 Pod 的终止日志，了解退出原因。

7. Evicted

含义

Pod 被驱逐出节点，通常是因为节点资源不足（如内存不足）。

常见原因：

节点资源压力过大。
Pod 的资源请求超过了节点的可用资源。

解决方法：

检查节点的资源使用情况：

kubectl top node

调整 Pod 的资源请求和限制，确保其符合节点的资源限制。
如果节点资源不足，可以考虑扩展集群。

8. ImagePullBackOff

含义：

Pod 无法拉取镜像，通常是因为镜像不存在或镜像仓库不可用。

常见原因：

镜像名称或版本错误。
镜像仓库需要认证，但未提供正确的凭证。
网络问题导致无法访问镜像仓库。

解决方法：

检查镜像名称和版本是否正确。
确保镜像仓库凭证已正确配置：

kubectl create secret docker-registry my-secret --docker-server= --docker-username= --docker-password= --docker-email=

检查网络连接，确保 Kubernetes 节点可以访问镜像仓库。

9. ErrImagePull

含义：

Pod 在拉取镜像时遇到错误。

常见原因：

镜像仓库不可用。
镜像不存在。
网络问题。

解决方法：

检查镜像仓库的可用性。
确保镜像名称和版本正确。

查看 Pod 的事件信息：

kubectl describe pod

10. CrashLoopBackOff

含义：

Pod 中的容器启动失败，并且 Kubernetes 正在尝试重新启动它。如果连续多次启动失败，Kubernetes 会暂停尝试，等待一段时间后再重试。

常见原因：

容器内部的程序崩溃。
容器启动时的配置错误。
容器依赖的服务不可用。

解决方法：

查看 Pod 的日志：

kubectl logs

检查 Pod 的事件信息：

kubectl describe pod

根据日志和事件信息排查问题。

以上十种状态是较为常见的，还有ContainerCreating这些中间状态就不一一列举详解了

END

往期推荐

1	Linux一键巡检脚本，建议收藏！
2	万字长文：K8S命令详解汇总【自用珍藏版】
3	实战：在已有K8S集群如何新增和删除Node节点

4	Linux的150个常用命令汇总，运维大神不一定全部掌握！
5	【Docker系列知识】常用命令大全汇总
6	手把手教你搭建Oracle19c RAC集群环境

1. Pending

含义：

常见原因：

解决方法：

2. Running

含义：

常见原因：

解决方法：

3. Succeeded

含义：

常见原因：

解决方法：

4. Failed

含义：

常见原因：

解决方法：

5. Unknown

含义

常见原因：

解决方法：

6. Terminating

含义

常见原因

解决方法：

7. Evicted

含义

常见原因：

解决方法：

8. ImagePullBackOff

含义：

常见原因：

解决方法：

9. ErrImagePull

含义：

常见原因：

解决方法：

10. CrashLoopBackOff

含义：

常见原因：

解决方法：

跳板机和堡垒机功能对比和选择推荐

高频面试题：描述K8S创建pod的全过程