具体可参见博客:https://blog.csdn.net/duguxiaobiao/article/details/91492965
新建容器(新建了一个名字叫 jk 的,镜像名叫 anibali/pytorch:cuda-10.0 bash 的,挂载了 /media/disk1 的内存大小为 10G的 容器)
nvidia-docker run -it -v /media/disk1:/usr/task --shm-size=10g --name jk anibali/pytorch:cuda-10.0 bash
docker run -it --gpus '"device=0,1"' -v /home/jinkan/project:/usr/project --shm-size=10g --name jk pytorch/pytorch:1.6.0-cuda10.1-cudnn7-devel /bin/bash
内存不够报错:DataLoader worker (pid XXXX) is killed by signal: Bus error(Pytorch多workers读取Data Loader)
在容器内部查看内存信息:df -h
解决方案:https://blog.csdn.net/qq_30852205/article/details/98723261
占用所有内存的新建容器方案
nvidia-docker run -it -v /media/disk1:/usr/task --ipc=host --name jk_task anibali/pytorch:cuda-10.0 /bin/bash
停止容器
docker stop 容器NAMES/容器ID
删除容器
docker rm 容器NAMES/容器ID
查看正在运行的容器
docker ps
查看所有容器,包括运行的和不运行的
docker ps -a
进入正在运行的容器
docker attach 容器NAMES/容器ID
退出容器并且容器继续运行
ctrl + p + q
退出容器(此时容器会停止运行)
exit
重启已停止的容器
docker start 容器ID