测试node挂 机,发布需要等几分才会 在其它 的node机器 启动,这个明显不合理,对于大多数业务
kube-controller-manager配置:
/etc/systemd/system/kube-controller-manager.service --node-monitor-grace-period=10s \ --node-monitor-period=3s \ --node-startup-grace-period=20s \ --pod-eviction-timeout=10s \
kubernetes节点失效后pod的调度过程:
0、Master每隔一段时间和node联系一次,判定node是否失联,这个时间周期配置项为 node-monitor-period ,默认5s 1、当node失联后一段时间后,kubernetes判定node为notready状态,这段时长的配置项为 node-monitor-grace-period ,默认40s 2、当node失联后一段时间后,kubernetes判定node为unhealthy,这段时长的配置项为 node-startup-grace-period ,默认1m0s 3、当node失联后一段时间后,kubernetes开始删除原node上的pod,这段时长配置项为 pod-eviction-timeout ,默认5m0s
在应用中,想要缩短pod的重启时间,可以修改上述几个参数
解释 官方有:
您可以选择一种方式赞助本站
支付宝扫一扫赞助
微信钱包扫描赞助
赏