1,docker 无法重启
Error response from daemon: cannot stop container: default-hive-hotel-hadoop-070-035.bigdata.ly: Cannot kill container aa7e1fbfec32728fdd6700548b2d7c28f7b9e98bf3f76a7efb1de54f430e5ea9: connection error: desc = "transport: dial unix /var/run/docker/containerd/docker-containerd.sock: connect: connection refused": unknown
现象:
docker 无法对容器进行启动,关闭,重启操作;报错如上
docker 运行5个月以上,服务出现异常
解决方法:
增加 /usr/lib/systemctl/system/docker.service --live-restore
重启docker 服务
systemctl daemon-reload
service docker restart
2,进入容器报错
unable to find user root: no matching entries in passwd file
原因
版本:17.12.0
1、物理服务器负载高了
2、docker服务出问题的,需要重启物理服务器
网上说:
执行docker cp命令,无论是从容器内部cp到容器外部,还是从容器外部cp到容器内部!
操作
重启需要先停在启动
docker stop
docker start
或者重启docker 服务,docker container
3,docker 重启失败,
重启机器后。启动docker ,最好的办法就是等,及时报错启动失败,也要等!!!
4,docker 启动服务的端口只能本地访问
重启docker服务,即可;
5,出现 文件流关闭错误。导致系统操作变慢;
单台机器重启docker service 并重新发布 cadvisor 可以解决;
有台机器直接卡死;
可能是因为health check 问题导致,本身的cadvisor 服务没有问题;
尝试关闭 cadvisor 健康检查功能;
bug
docker版本 17.12
https://github.com/moby/moby/issues/35891
6,docker service 增加 live-store 模式。重启;然后在去掉 live-store 模式。再重启;部分容器就会处于游离状态;docker
服务重启,容器不会重启;
6,docker service 产生大量的 closewait
升级 docker
7, container 无法关闭,无法登录,等操作无法执Å行;
解决方法:直接kill掉docker runc 的进程;通过container id 找到进程;
8,无法创建容器;
重启,升级
9,docker-proxy 占用端口
dockerproxy 占用未绑定端口,不释放。且kill dockerproxy 变僵尸进程,处理办法,iptables 删除规则;
查看 nat 链
iptables -nvL -t nat
删除该链第二条
iptables -D DOCKER 2 -t nat
10,
docker 启动服务,端口无法绑定,容器状态正常
ps -A -ostat,ppid,pid,cmd | grep -e '^[Zz]'
查看有僵尸进程;
只能关掉docker 重启机器;升级版本;
总结:
以上这些问题主要是17.12 目前出现问题后就是重启,有些时候重启docker service 无法关停 container 进程,需要进行手动关掉container 通过 ps aux|grep docker|awk '{print $2}' |xargs kill ,如无法正常kill 建议 kill -9。之后进行docker 的升级操作。
目前我在用的18.3 版本相对稳定,但也会出现 docker service 出现问题,导致无法操作容器。建议考虑新版本。