在 GPU 主机安装 Nvidia驱动(可省略)
参见:https://ubuntu.com/server/docs/nvidia-drivers-installation
可省略,后面安装CUDA时也能安装驱动
在 GPU 主机安装 CUDA
- 安装依赖包
apt install gcc make
- 下载和安装CUDA,参见:https://developer.nvidia.com/cuda-downloads ,使用 runfile 文件安装
- 设置环境变量
cat >> /etc/profile <<EOF
# Nvidia CUDA
export PATH=/usr/local/cuda/bin\${PATH:+:\${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda/lib64\${LD_LIBRARY_PATH:+:\${LD_LIBRARY_PATH}}
EOF
在 GPU 主机安装 NVIDIA Container Toolkit
参见:https://docs.nvidia.com/datacenter/cloud-native/container-toolkit/latest/install-guide.html
注:把 nvidia 设为 containerd 的默认运行时
nvidia-ctk runtime configure --runtime=containerd --set-as-default