kubernetes node节点失效 调度

avatar 2022年8月17日18:17:32 评论 686 次浏览

kubernetes 配置:

测试node挂 机,发布需要等几分才会 在其它 的node机器 启动,这个明显不合理,对于大多数业务

kube-controller-manager配置:

  1. /etc/systemd/system/kube-controller-manager.service
  2.  
  3. --node-monitor-grace-period=10s \
  4. --node-monitor-period=3s \
  5. --node-startup-grace-period=20s \
  6. --pod-eviction-timeout=10s \

kubernetes节点失效后pod的调度过程:

  1. 0Master每隔一段时间和node联系一次,判定node是否失联,这个时间周期配置项为 node-monitor-period ,默认5s
  2.  
  3. 1、当node失联后一段时间后,kubernetes判定nodenotready状态,这段时长的配置项为 node-monitor-grace-period ,默认40s
  4.  
  5. 2、当node失联后一段时间后,kubernetes判定nodeunhealthy,这段时长的配置项为 node-startup-grace-period ,默认1m0s
  6.  
  7. 3、当node失联后一段时间后,kubernetes开始删除原node上的pod,这段时长配置项为 pod-eviction-timeout ,默认5m0s

在应用中,想要缩短pod的重启时间,可以修改上述几个参数

解释 官方有:

avatar

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen:

滑动解锁才能提交