加载中...

显卡驱动+cuda+cudnn+深度学习框架


安装概览

安装显卡驱动、CUDA 和 cuDNN 可能因操作系统和 GPU 型号而异,下面是一般的步骤:

  1. 下载和安装适合你 GPU 型号的显卡驱动,可以从官方网站或者 GPU 制造商的网站下载。
  2. 下载和安装适合你 CUDA 版本的 CUDA 工具包,可以从官方网站下载。
  3. 下载和安装适合你 CUDA 版本的 cuDNN 库,可以从 NVIDIA Developer 网站下载。
  4. 配置环境变量,以便你的系统能够找到 CUDA 和 cuDNN 的库文件。

注意:显卡、驱动、CUDA、cuDNN、Python和深度学习环境(TensorFlow等)都要匹配

尤其是 TensorFlow1.0 和 2.0 的使用对显卡等版本要求严格。

例如:GTX 1050 + CUDA10.1 + python3.8 + tensorflow2.3.0

1. 安装驱动

不同操作系统和显卡型号需要使用不同的命令来安装显卡驱动,下面是几个常见的操作系统的命令:

1.1 Windows

在 Windows 系统中,你可以通过官方网站下载适合你显卡型号的驱动程序,然后运行 .exe 文件进行安装。在安装过程中,你可以根据提示选择“自定义安装”选项来选择需要安装的组件。

1.2 Ubuntu

在 Ubuntu 中,你可以使用 ubuntu-drivers 命令来自动安装显卡驱动程序。这个命令是 Ubuntu 提供的官方工具,用于识别和安装适用于硬件的推荐和建议驱动程序。

首先,你需要更新软件包列表和已安装软件包的版本:

sudo apt update
sudo apt upgrade

然后,安装 ubuntu-drivers 命令行工具:

sudo apt install ubuntu-drivers-common

接下来,你可以运行下面的命令来获取可以使用的所有驱动程序的列表:

sudo ubuntu-drivers list

然后,你可以使用下面的命令来安装推荐的驱动程序:

sudo ubuntu-drivers autoinstall

# 或者
sudo apt install nvidia-driver-470

需要注意的是,ubuntu-drivers 命令不会安装 NVIDIA CUDA 和 cuDNN 等其他必需的组件,你需要另外安装它们来进行深度学习开发。

最后输入 nvidia-smi 查看是否安装成功。(所有系统通用命令)

nvidia-smi

1.3 MacOS

在 MacOS 系统中,你可以通过以下步骤来安装显卡驱动:

  1. 检查系统中是否安装了其他版本的显卡驱动,可以使用以下命令来查看:
kextstat | grep -i "nvidia"

如果输出了 NVIDIA 的信息,说明系统中已经安装了显卡驱动。

  1. 下载适合你显卡型号和 MacOS 版本的显卡驱动,可以从NVIDIA官方网站下载。

  2. 双击下载的 .dmg 文件,然后按照提示进行操作,通常会要求你输入管理员密码。

  3. 安装完成后,重启系统即可。

2. 安装cuda

windows 无脑装.exe,同样不要安装驱动,主要介绍 Ubuntu 的安装

首先在 Nvidia 官网下载适合自己机器的 CUDA 版本,官网下载,使用 runfile 的方式安装

可以直接将网址复制到浏览器下载,或者命令行 wget 下载

接着输入安装命令,按照指示即可

sudo sh cuda_*.run

如果电脑没有安装Nvidia显卡驱动,安装会顺利进行;若已经安装了Nvidia驱动,会提醒移除可以选择Abort退出,之后去删除驱动,也可以直接继续Continue,我选择Continue

选择accpet接受协议

取消勾选第一个driver,直接回车就能取消前面的[X],然后install

根据提示的信息,配置环境变量

sudo vi ~/.bashrc   
export CUDA_HOME=/usr/local/cuda-11.3
export PATH=$CUDA_HOME/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-11.3/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}

然后刷新环境变量

source ~/.bashrc 

测试CUDA是否安装成功

nvcc -V

显示下图,说明成功

3. 安装cuDNN

下载cuDNN ,官网(未注册的话,注册一个账号即可)

解压复制到 cuda 路径下

tar -zxvf cudnn*
sudo cp cuda/include/cudnn.h /usr/local/cuda/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn* 

安装deb

sudo dpkg -i libcudnn8_8.0.5.39-1+cuda11.0_amd64.deb

sudo dpkg -i libcudnn8-dev_8.0.5.39-1+cuda11.0_amd64.deb 

sudo dpkg -i libcudnn8-samples_8.0.5.39-1+cuda11.0_amd64.deb

测试

cd /usr/local/cuda/samples/1_Utilities/deviceQuery 
sudo make 
./deviceQuery 

结果为PASS就成功了。

sudo make clean  #洁癖患者请清除编译

4. 安装深度学习框架

# 安装 cuda=11.3 专属 pytorch
conda install pytorch==1.12.1 torchvision==0.13.1 torchaudio==0.12.1 cudatoolkit=11.3 -c pytorch
pip install torch==1.12.1+cu113 torchvision==0.13.1+cu113 torchaudio==0.12.1 --extra-index-url https://download.pytorch.org/whl/cu113
# GPU 版本
pip install tensorflow-gpu==2.3.0

# CPU 版本
pip install tensorflow==2.3.0

文章作者: JiJunhao
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 JiJunhao !
  目录