- U盘制作启动盘,安装引导;略过;
- 安装nvidia驱动
- 教程参考:Rocky linux安装3090 + CUDA11.3 + pytorch - 知乎
- 驱动下载:Nvidia官网下载对应显卡驱动,网址略
# 确定系统版本
uname -a
uname -r
# 查看当前电脑的显卡型号
lshw -numeric -C display
# 命令行搜索集显和独显
lspci | grep VGA
lspci | grep NVIDIA
# 关闭默认gpu驱动,也就是禁用nouveau
# 修改配置文件
vim /usr/lib/modprobe.d/dist-blacklist.conf
# 注释
#blacklist nvidiafb
# 添加以下语句
blacklist nouveau
blacklist lbm-nouveau
options nouveau modeset=0
alias nouveau off
alias lbm-nouveau off
# 重启后,执行如下命令,如果没有屏幕输出,说明禁用nouveau成功
lsmod | grep nouveau
--kernel-source-path=/usr/src/kernels/$(uname -r)/ -k $(uname -r)
1. bug: uname -r和实际的/usr/src/kernels/下的名称不是完全一致,解决办法,手动给路径 --kernel-source-path=/usr/src/kernels/5.xxxxxxx -k 5.xxxxxx
先要确保这个路径下面有东西:ls /usr/src/kernels/
- 自己下载离线kernel安装,出了太多bug了
- https://pkgs.org/download/kernel-devel
- https://yum.oracle.com/repo/OracleLinux/OL9/appstream/x86_64/getPackage/kernel-devel-5.14.0-162.6.1.el9_1.x86_64.rpm
- 然后如何安装,rpm安装缺乏依赖:改为:` sudo yum install ./kernel-devel-5.14.0-162.6.1.el9_1.x86_64.rpm ` 即可!!!自动装上依赖了。
sudo yum install ./kernel-devel-5.14.0-162.6.1.el9_1.x86_64.rpm
# 执行下面操作,若有和uname -r一样的文件夹,即可安装显卡驱动
ls /usr/src/kernels/
5.14.0-162.6.1.el9_1.x86_64
2. bug:x server 用命令禁止掉 --no-x-check
2Linux安装nvidia遇到的问题you appear to be running an x server please exit x before installing_纽约恋情的博客-CSDN博客
# 我使用这个无效
sudo /etc/init.d/lightdm stop
sudo /etc/init.d/lightdm status
# 有用的办法是
https://zhuanlan.zhihu.com/p/115758882
sudo ./NVIDIAxxxx.run --no-x-check
3.bug: nvidia-smi无法同nvidia驱动通信, 解决办法:kernel-header版本过高,需要重新下载离线包安装
我的kernel-header版本也抬高了,需要下载对应的rpm,离线安装,然后再装nvidia驱动,就好了。一波三折阿
然后继续重装nvidia驱动,成功了。
# 这一步骤要修改,很容易出现kernel版本和内核版本不一致的情况
# sudo yum install kernel-devel elfutils elfutils-devel glibc-devel
# sudo yum install "kernel-devel-uname-r == $(uname -r)"
sudo yum install ./kernel-devel-5.14.0-162.6.1.el9_1.x86_64.rpm
sudo yum install ./kernel-headers-5.14.0-162.6.1.el9_1.x86_64.rpm
# 备份initramfs配置文件
sudo mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak
# 重建initramfs文件
sudo dracut -v /boot/initramfs-$(uname -r).img $(uname -r)
# 添加执行权限
sudo chmod +x NVIDIA-Linux-x86_64-515.48.07.run
# 安装驱动
sudo ./NVIDIA-Linux-x86_64-515.48.07.run --no-opengl-files --kernel-source-path=/usr/src/kernels/$(uname -r)/ -k $(uname -r) --no-x-check
# 由于不是完全一致,就采用手动给路径的办法,成功了。
sudo ./NVIDIA-Linux-x86_64-535.113.01.run --no-opengl-files --kernel-source-path=/usr/src/kernels/5.14.0-162.6.1.el9_1.x86_64/ -k 5.14.0-162.6.1.el9_1.x86_64 --no-x-check
# --no-opengl-files 表示只安装驱动文件,不安装OpenGL文件。这个参数不可省略,否则会导致登陆界面死循环,英语一般称为”login loop”或者”stuck in login”。
# –-no-x-check 表示安装驱动时不检查X服务,非必需。
# –-no-nouveau-check 表示安装驱动时不检查nouveau,非必需。
# -Z, --disable-nouveau:禁用nouveau。此参数非必需,因为之前已经手动禁用了nouveau。
# 安装过程中,选择accept
# 如果提示要修改xorg.conf,选择yes
# 重新启动,查看显卡是否正常启动
# 检查驱动是否安装成功
nvidia-smi
# nvidia-settings
!!!若yum不存在内核版本的kernel,就换源:换源之后,还是没有!!
solution:下载kernel离线rpm包,用yum install安装
rocky9.1 yum 换源:
- Rocky Linux 国内镜像源列表_rockylinux国内镜像-CSDN博客
sed -e 's|^mirrorlist=|#mirrorlist=|g' \
-e 's|^#baseurl=http://dl.rockylinux.org/$contentdir|baseurl=https://mirrors.aliyun.com/rockylinux|g' \
-i.bak \
/etc/yum.repos.d/[Rr]ocky*.repo
安装了epel,修改如下:
sed -e 's|^metalink=|#metalink=|g' \
-e 's|^#baseurl=https://download.example/pub|baseurl=https://mirrors.aliyun.com|g' \
-i.bak \
/etc/yum.repos.d/epel*.repo
# 注意:
# Rocky Linux 中 #baseurl=https://download.example/pub
# 与 CentOS 相同,而 Alma Linux #baseurl=https://download.fedoraproject.org/pub
清理并重新生成软件包;速度一下就快了,达到1M/s,应该是国内源更换成功了。
yum clean all
yum autoremove
rm -rf /var/cache/yum
yum makecache
二、rocky9 gcc版本降级
https://ftp.lysator.liu.se/pub/opensuse/distribution/leap/15.5/repo/oss/x86_64/gcc9-9.3.1+git1296-1.6.1.x86_64.rpm
1. 通过rpm依赖安装,看看能不能降级
- 发现没有生存libiberty.so 编译这个库时有困难;发现build文件夹中,mpc等都为空,应该是找不到libmpc等,就是库链接有问题
- 就将/usr/local/lib下的四个依赖库的文件都拷贝到x86_pc_linux文件夹下,这个库就生成了!!!
make[3]: 离开目录“/home/dl/software/gcc-9.2.0/gcc-build-9.2.0/libiberty”
make[2]: 离开目录“/home/dl/software/gcc-9.2.0/gcc-build-9.2.0”
make[1]: *** [Makefile:26574:stage1-bubble] 错误 2
make[1]: 离开目录“/home/dl/software/gcc-9.2.0/gcc-build-9.2.0”
make: *** [Makefile:1002:all] 错误 2
三、其他软件安装
snap 安装Iptux
Install iptux on Linux | Snap Store
sudo dnf install https://dl.fedoraproject.org/pub/epel/epel-release-latest-8.noarch.rpm
sudo yum install snapd
sudo systemctl enable --now snapd.socket
sudo snap install iptux