一、验证自己的电脑是否有一个可以支持CUDA的GPU
在终端中输入命令: $ lspci | grep -i nvidia ,会显示出你的NVIDIA GPU版本信息,
然后去CUDA的官网查看自己的GPU版本是否在CUDA的支持列表中。
二、选择安装方式
这里采用runfile安装方式。
下载cuda安装包:cuda官网下载,根据系统信息选择对应的版本,runfile安装的话最后一项要选择 runfile文件。
三、runfile安装cuda
- 禁用 nouveau驱动
终端中运行:
$ lsmod | grep nouveau
如果有输出则代表nouveau正在加载。需要我们手动禁掉nouveau。
Ubuntu的nouveau禁用方法:
a、在/etc/modprobe.d中创建文件blacklist-nouveau.conf
输入命令:
sudo vim /etc/modprobe.d/blacklist-nouveau.conf
在文件中输入一下内容:
blacklist nouveau
options nouveau modeset=0
重启
sudo reboot
重启后,不要登录界面,否则可能会失败,若不小心进入,请重启电脑,直接按Ctrl+Alt+F1进入文本模式,登录账户。:
$ lsmod | grep nouveau
若无内容输出,则禁用成功。
输入
sudo service lightdm stop
关闭图形化界面
- 进入到cuda路径
运行
sudo sh cuda_7.5.18_linux.run
按照提示一步步操作
注:a、一定要按照提示)输入相应字符,例如有的需要输入accept,有的需要输入yes;这里选择安装cuda带的显卡,显卡组件可以进入选项,勾选不安装opengl files的选项。
安装成功后,会显示installed,否则会显示failed。
- 输入 $ sudo service lightdm start 重新启动图形化界面。
同时按住Alt + ctrl +F7,返回到图形化登录界面,输入密码登录。
如果能够成功登录,则表示不会遇到循环登录的问题,基本说明CUDA的安装成功了。
四、 相关配置
执行
$ ls /dev/nvidia*
ls: cannot access/dev/nvidia*: No such file or directory
需要要添加一个启动脚本:
sudo vim /etc/rc.local
#!/bin/sh
/sbin/modprobe nvidia
if [ "$?" -eq 0 ]; then
NVDEVS=`lspci | grep -i NVIDIA`
N3D=`echo "$NVDEVS" | grep "3D controller" | wc -l`
NVGA=`echo "$NVDEVS" | grep "VGA compatible controller" | wc -l`
N=`expr $N3D + $NVGA - 1`
for i in `seq 0 $N`; do
mknod -m 666 /dev/nvidia$i c 195 $i
done
mknod -m 666 /dev/nvidiactl c 195 255
else
exit 1
fi
/sbin/modprobe nvidia-uvm
if [ "$?" -eq 0 ]; then
D=`grep nvidia-uvm /proc/devices | awk '{print $1}'`
mknod -m 666 /dev/nvidia-uvm c $D 0
else
exit 1
fi
下次重启时,输入:$ ls /dev/nvidia*
结果显示:/dev/nvidia0(有几个显卡显示几个) /dev/nvidiactl /dev/nvidia-uvm
- 设置环境变量。
终端中输入 $ sudo gedit /etc/profile
在打开的文件末尾,添加以下两行。
export PATH=/usr/local/cuda-10.2/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-10.2/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
保存文件,并重启,检查上述的环境变量是否设置成功。
a、 验证驱动版本
敲入
$ cat /proc/driver/nvidia/version
结果显示
NVRM version: NVIDIA UNIX x86_64 Kernel Module 384.81 Sat Sep 2 02:43:11 PDT 2017
GCC version: gcc version 5.4.0 20160609 (Ubuntu 5.4.0-6ubuntu1~16.04.5)
b、 验证CUDA Toolkit
敲入
$ nvcc -V 会输出CUDA的版本信息
如果是这样的:
The program ‘nvcc’ is currently not installed. You can install it by typing:
sudo apt-get install nvidia-cuda-toolkit
可能是环境配置没有成功,请重复上述步骤7)。
五、 安装cudnn
安装 cudnn
去Nvidia官网 登录然后下载。
cudnn 包含两个版本 Runtime 和 Developer 版本,区别是:
developer library 包含了在Ubuntu系统上开发深度学习时所需的cuDNN头文件,如果你不需要开发编译任何深度学习程序,而只是将其用于运行某些深度学习应用,那么只下载“runtime library”就足够了。
下载驱动的对应版本
注册,下载对应的deb版本即可:
sudo dpkg -i xxx.deb
六、 卸载显卡驱动和cuda
按Ctrl + Alt + f1,进入终端:
sudo /usr/local/cuda-8.0/bin/uninstall_cuda_8.0.pl
sudo /usr/bin/nvidia-uninstall
sudo apt-get remove nvidia-*
sudo apt-get autoremove