Pod phase
Pod 的 status
属性是一个 PodStatus 对象,拥有一个 phase
字段。它简单描述了 Pod 在其生命周期的阶段。
阶段 | 描述 |
---|---|
Pending | Pod 已被 Kubernetes 接受,但尚未创建一个或多个容器镜像。这包括被调度之前的时间以及通过网络下载镜像所花费的时间,执行需要一段时间。 |
Running | Pod 已经被绑定到了一个节点,所有容器已被创建。至少一个容器正在运行,或者正在启动或重新启动。 |
Succeeded | 所有容器成功终止,也不会重启。 |
Failed | 所有容器终止,至少有一个容器以失败方式终止。也就是说,这个容器要么已非 0 状态退出,要么被系统终止。 |
Unknown | 由于一些原因,Pod 的状态无法获取,通常是与 Pod 通信时出错导致的。 |
Pod conditions
每个 Pod 都拥有一个 PodStatus,里面包含 PodConditions 数组,代表 Condition 是否通过。PodCondition 属性描述:
字段 | 描述 |
---|---|
lastProbeTime | 最后一次探测 Pod Condition 的时间戳。 |
lastTransitionTime | 上次 Condition 从一种状态转换到另一种状态的时间。 |
message | 上次 Condition 状态转换的详细描述。 |
reason | Condition 最后一次转换的原因。 |
status | Condition 状态类型,可以为 True False Unknown
|
type | Condition 类型 |
关于 Condition Type 的描述:
Type | 描述 |
---|---|
PodScheduled | Pod 已被调度到一个节点 |
Ready | Pod 能够提供请求,应该被添加到负载均衡池中以提供服务 |
Initialized | 所有 init containers 成功启动 |
Unschedulable | 调度器不能正常调度容器,例如缺乏资源或其他限制 |
ContainersReady | Pod 中所有容器全部就绪 |
Container probes
Probe 是在容器上 kubelet 的定期执行的诊断,kubelet 通过调用容器实现的 Handler 来诊断。目前有三种 Handlers :
- ExecAction:在容器内部执行指定的命令,如果命令以状态代码 0 退出,则认为诊断成功。
- TCPSocketAction:对指定 IP 和端口的容器执行 TCP 检查,如果端口打开,则认为诊断成功。
- HTTPGetAction:对指定 IP + port + path路径上的容器的执行 HTTP Get 请求。如果响应的状态代码大于或等于 200 且小于 400,则认为诊断成功。
每次探测可能有如下之一的结果:
- Success:容器诊断通过
- Failure:容器诊断失败
- Unknown:诊断失败,因此不应采取任何措施
kubelet 可以选择性地对运行中的容器进行两种探测器执行和响应:
-
livenessProbe
:指示容器是否正在运行,如果活动探测失败,则 kubelet 会杀死容器,并且容器将受其 重启策略 的约束。如果不指定活动探测,默认状态是Success
。 -
readinessProbe
:指示容器是否已准备好为请求提供服务,如果准备情况探测失败,则控制器会从与 Pod 匹配的所有服务的端点中删除 Pod 的 IP 地址。初始化延迟之前的默认准备状态是Failure
,如果容器未提供准备情况探测,则默认状态为Success
。
示例: spring-boot 应用的探测
apiVersion: apps/v1
kind: Deployment
metadata:
***
spec:
***
containers:
***
readinessProbe: # ---- 准备状态检查 ----
httpGet:
path: /actuator/health
port: 8080
timeoutSeconds: 2 # 探测超时时长,单位:秒
initialDelaySeconds: 60 # 初始化时间,单位:秒
livenessProbe: # ---- 健康状态检查 ----
httpGet:
port: 8080
path: /actuator/info
failureThreshold: 3 # 最大失败次数
timeoutSeconds: 2 # 探测超时时长,单位:秒
initialDelaySeconds: 60 # 初始化时间,单位:秒
periodSeconds: 5 # 探测时间间隔,单位:秒
successThreshold: 1 # 失败后探测成功的最小连续成功次数
Pod lifetime
通常,Pod 不会消失,除非人为或者控制器销毁它们。此规则的唯一例外情况是,Success
或 Failed
阶段超过一段时间(由主服务器中的 terminate-pod-gc-threshold
确定)的 Pod 将过期并自动销毁。
三种可用的控制器类型:
-
Job:例如批量计算,仅适用于
restartPolicy
为OnFailure
或Never
的 Pod -
ReplicationController, ReplicaSet, 或 Deployment:例如 Web 服务,ReplicationControllers 仅适用于
restartPolicy
为Always
的 Pod。 - DaemonSet:需要在每个节点运行一个的 Pod,以便用于系统服务。