其实在之前制作完Docker镜像之后,我就用Docker运行过一次程序,但可能最近比较忙,就没有用他来调试PyTorch,下面我记录了一次成功运行PyTorch的经历
首先我们进入Docker
docker run -it --gpus all -v /data4/wangyh:/res nvidia/cuda:v5 /bin/bash`
进入Docker之后进入到res文件夹找到docker中挂载的程序,然后用torch.distributed.launch来运行程序,如下
python -m torch.distributed.launch --nproc_per_node 8 tran.py