目前情况
我这里有一台 从算法组借用的 GPU
服务器,里边是 两张 2070 Super 8GB
。
使用命令查看当前的
nvidia-smi
更细系统
先对系统进行一个升级,后续避免安装依赖的过程中出现一些莫名其妙的错误。
sudo apt update
执行下面的指令,完成前置依赖的安装,可能会比较漫长:
sudo apt install -y build-essential libbz2-dev libssl-dev libffi-dev zlib1g-dev libncurses5-dev libncursesw5-dev libreadline-dev libsqlite3-dev wget curl llvm libncurses5-dev libncursesw5-dev xz-utils tk-dev libxml2-dev libxmlsec1-dev libffi-dev liblzma-dev
此外还有一些别的依赖,也一块安装了:
sudo apt install -y make build-essential libssl-dev zlib1g-dev libbz2-dev /libreadline-dev libsqlite3-dev wget curl llvm libncurses5-dev libncursesw5-dev /xz-utils tk-dev libffi-dev liblzma-dev python-openssl git
安装 Pyenv
直接安装
和 编译安装
二选一即可!
直接安装
curl https://pyenv.run | bash
编译安装
git clone https://github.com/pyenv/pyenv.git ~/.pyenv# 可选的编译步骤cd ~/.pyenv && src/configure && make -C src
配置环境
安装完成之后,我们需要往环境变量中写一些内容,才可以完成后续的工作。
echo 'export PATH="$HOME/.pyenv/bin:$PATH"' >> ~/.bashrcecho 'eval "$(pyenv init --path)"' >> ~/.bashrcecho 'eval "$(pyenv virtualenv-init -)"' >> ~/.bashrcsource ~/.bashrc
验证结果
pyenv --version
更新CUDA
目前项目要求的python版本是3.10
,对应的Pytorch
:
PyTorch官方网站
根据你的操作系统内容选择。这里可以看到,需要的CUDA
为12.1
但是刚才我们nvidia-smi
看到的CUDA是11.2
。所以我们需要升级CUDA
版本。
我们需要在官方找到12.1
的对应要求。
目前我们的情况是:
- Ubuntu 18
- 2070Super x2
- CUDA 11.2
目标情况是:
- Ubuntu 18 -> (可选择) 20LTS
- CUDA 12.1(Pytorch要求)
CUDA 12.1 官方下载地址 Nvidia
打开之后,根据自己的情况,进行选项卡的选择。
这里我有科学上网,所以走 network,可能会多次重启之类的,你根据提示操作就好。
下载deb
安装文件
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/cuda-keyring_1.0-1_all.deb
安装deb
文件
sudo dpkg -i cuda-keyring_1.0-1_all.deb
再次更新系统,同时安装 CUDA
sudo apt-get updatesudo apt-get -y install cuda
检查结果
最后更新完,我们的CUDA版本已经到了12.1: