Linux 服务器下非root用户安装CUDA完整流程(多次踩雷经验总结)

服务器 0

参考博客:

linux下安装cuda和cudnn(非root权限)_cuda下载安装 远程服务器 linux-CSDN博客

Linux下非root用户安装CUDA_linux下cuda-toolkit-archive-CSDN博客

非root用户安装cuda10.1,以及CUDA不同版本间切换_非root用户.run文件怎么安装-CSDN博客

前言(关于为什么会有这篇博客)

深度学习免不了需要CUDA加速,但是在诸多的CUDA安装教程中使用的都是sudo命令,服务器只有一个管理员,非管理员用户无法使用sudo命令,更新和安装CUDA通常会出现如下报错

不在 sudoers 文件中。此事将被报告。

一、清楚服务器的版本

1.1查看操作系统版

命令行输入

cat /proc/version

由此确定服务器linux操作系统的版本 可以看出本台服务器为Ubuntu20.04版本

后面在官网下载CUDA要用到

1.2查看服务器支持的CUDA的最高版本

nvidia-smi

本台服务器支持的CUDA的最高版本是12.0

后面在官网下载CUDA也要用到

二、CUDA的下载与安装

2.1 选择版本

转到CUDA官网 CUDA Toolkit Archive | NVIDIA Developer

我这里根据我的服务器选择的版本是12.0.0

点进去出现更详细的版本选择界面

根据自己服务器版本选(前面说过如何查看服务器版本了)

因为没有sudo权限,所以安装类型选择runfile(组里的师兄告诉的)其他的安装方式我也没有尝试

2.2 下载安装包

这时候会发现下面出现了安装指令

一步一步运行

在命令行输入

wget https://developer.download.nvidia.com/compute/cuda/12.0.0/local_installers/cuda_12.0.0_525.60.13_linux.run

过一会发现文件下载到了当前用户的目录下

2.3 安装runfile文件

在安装之前要新建一个CUDA的文件夹 用来作为安装路径 否则默认安装路径没有权限也会以报错

如上图,我的路径是home/XXX/CUDA12.0.0(后面要考)

接下来就是安装

会发现直接使用官网给出的命令会报错 因为没有sudo权限

很简单 去掉sudo就好

命令行输入

sh cuda_12.0.0_525.60.13_linux.run

(如果下载的和我不是一个版本 要换成自己下载的文件的名称)

这时候就进去了安装界面

问你accept嘛?就输入accept

后面的流程照着我的改(千万记得修改为自己的路径)

1.取消driver(空格 ENTER可以取消)

2.下键↓ 进入Options(ENTER 进入)
3.进入Toolkit Options

4.修改Toolkit路径(修改为新建文件夹路径)

5.Done退出

6.同理修改Library路径(也是新建文件夹的路径)
7.Done 退出
8.Install安装

9.出现如下字符安装成功

10.修改bashrc

命令行输入vim ~/.bashrc

按 i 键进入插入模式

修改后三行(对应的地方改成自己的路径)

export CUDA_HOME=$CUDA_HOME:/home/XXX/CUDA12.0.0export PATH="/home/XXX/CUDA12.0.0/bin:$PATH"export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/home/XXX/CUDA12.0.0/lib64

编辑好文本后按Esc,退出插入状态

输入冒号,输入wq 回车

11.
source ~/.bashrc

三、CUDNN安装与下载

3.1官网下载cudnn

这里需要注册账号 ,没有什么会踩雷的地方,就跳过,直接进入下载步骤

cuDNN Archive | NVIDIA Developer

这个下载到自己的电脑 下载到本地就好

3.2本地解压(本地指自己的电脑区别于服务器)

解压两次 直到出现子文件夹

3.3上传Cudnn文件

在服务器新建一个文件夹 例如我的是/home/XXX/Cudnn

把解压后的所有文件上传到所有文件夹里

我用的是Xftp 可以直接传输 如果不能建议搜一下其他博客如何通过命令行的指令传输

3.4 复制文件:把Cudnn文件夹下的文件复制到CUDA下

首先跳转到Cudnn文件夹下

cd /home/XXX/Cudnn

复制(换成自己的路径)

cp /home/XXX/Cudnn/include/cudnn.h /home/XXX/CUDA12.0.0/include/​cp /home/XXX/Cudnn/lib/libcudnn* /home/XXX/CUDA12.0.0**/lib64/

修改权限

chmod a+r /home/XXX/CUDA12.0.0/include/cudnn*.h​chmod a+r home/XXX/CUDA12.0.0/lib64/libcudnn*

第二条指令可能会报错,

如果报错,修改为:

chmod a+r /home/XXX/CUDA12.0.0/targets/x86_64-linux/lib/libcudnn*

查看是否安装成功

查看版本:

nvcc -V

出现版本信息表示安装成功

查看安装路径:

which nvcc

至此结束


第一次写博客 语言的专业性和精炼有待提升 如果没有讲清楚的地方欢迎提问

也许您对下面的内容还感兴趣: