时间:2024.9.3
1)bug:
self._store = TCPStore( # type: ignore[call-arg]
RuntimeError: Address already in use
2)原因分析
linux下pytorch多卡训练深度学习模型,训练中途暂停训练,但仍有进程占用某个端口。
3)解决方法
netstat -nltp
kill -9 pid
微信扫一扫
时间:2024.9.3
self._store = TCPStore( # type: ignore[call-arg]
RuntimeError: Address already in use
linux下pytorch多卡训练深度学习模型,训练中途暂停训练,但仍有进程占用某个端口。
netstat -nltp
kill -9 pid
相关推荐