Win10下安装PytorchGPU版本

2023-09-27 15:57:47
标签: pytorch pip python

作者: Sam(甄峰) sam_code@hotmail.com

0. 背景介绍:

0.1:训练机介绍:

主板为技嘉B85M-D3V-A. 显卡为Nvidia GeForce RTX 1080. 使用WD 1T 硬盘和一个附加硬盘盒。

CPU:Intel(R) Core(TM) i7-7700.

0.2:Cuda安装背景:

打开Pytorch官网,看到当前版本需要CUDA11.7.

 

并需要安装cudnn.

所以,需求很明确:

A. 安装GeForce RTX1080 driver.

https://www.nvidia.cn/Download/index.aspx?lang=cn

B. 安装Cuda Toolkit.

https://developer.nvidia.com/cuda-11-7-0-download-archive?target_os=Windows&target_arch=x86_64&target_version=11

C. 安装cudnn.

https://developer.nvidia.com/rdp/cudnn-archive

D. 安装Python+pip.

https://www.python.org/downloads/windows/

E. 安装Pytorch.

 

 

0.3:CUDA与Nvidia Driver, 与显卡的关系:

Nvidia driver版本和cuda版本有其对应关系,安装driver后,需要查看其最大支持的cuda版本,再行安装,否则会产生错误如下:

(base) PS C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.0\extras\demo_suite> .\deviceQuery.exe

C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.0\extras\demo_suite\deviceQuery.exe Starting...

 CUDA Device Query (Runtime API) version (CUDART static linking)

cudaGetDeviceCount returned 35

-> CUDA driver version is insufficient for CUDA runtime version

Result = FAIL

这里表示driver版本与CUDA版本不匹配。

那如何知道对应关系呢? 有两个途径:

A. https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html


可以看到, CUDA11.7, 至少需要Driver 516.31.

B:

 

这里可以看到, Driver只有471.55. 不符合CUDA11.7.


 

这里可以看到,这个driver最多支持到CUDA11.4.  

所以,需要升级Driver.


1. 安装Nvidia Driver和Cuda toolkit.

1.1: Nvidia driver:

https://www.nvidia.cn/Download/index.aspx?lang=cn

选中对应的driver.   1080. 选择了稳定版本Studio 驱动。

安装之。


1.2: 安装Nvidia Cuda toolkit:

既然选中了11.7. 则下载对应版本:

安装之。

此时再看Nvidia信息:

 

可以看到 driver:537.42.  高于CUDA11.7要求的516.31. 同时,它所支持的最高CUDA Toolkit:12.2. (注意:此处显示的此driver支持的最高Cuda Toolkit版本,并非当前安装的Cuda ToolKit版本。)

查看信息:

 

可以看到,显示Cuda Toolkit版本为:11.7.


另一种验证:

 

 

 

此时,Sam不知如何查看Pytorch所需要的cudnn. (Paddle是直接指定对应cudnn版本的)。 于是只好先安装pytorch.


2. 安装Anaconda:

因为可能在环境中安装多个训练框架,每个训练框架依赖的Python version, 相关Package不同。所以选Anaconda.

而当前Pytorch Windows版本支持的Python版本为: PyTorch on Windows only supports Python 3.8-3.11

2.1:下载:

https://www.anaconda.com/download-success

选中windows对应版本。

2.2:安装:

正常安装即可。


3. Anaconda中创建Pytorch工作环境:

打开anaconda Prompt,

3.1:检查python版本:

python --version

显示:Python 3.11.5. 

符合之前Pytorch的要求。

3.2:创建pytorch虚拟环境:

conda create -n pytorch python=3.11

此时提示需要下载N多东西,选择Y。

创建完成后,查看环境:

conda info --envs

可以看到当前除了base外,还建立了pytorch环境。

3.3:进入pytorch虚拟环境:

conda activate pytorch


4. 在Anaconda新的虚拟环境中安装Pytorch.

4.1:

Pytorch官网中说明:

 

conda install pytorch torchvision torchaudio pytorch-cuda=11.7 -c pytorch -c nvidia

需要安装大量东西。

包括:pip install opencv

pip install opencv-contrib-python

尤其是opencv-contrib-python, 可以使用imshow()等。

4.2:验证:

conda list

查看pytorch是否可用:

import torch

torch.cuda.is_available()

 

 

4.3:查看cudnn version:

import torch

torch.backends.cudnn.version()

8500.

Sam认为它指出cudnn 8.5是可用的。

https://developer.nvidia.com/rdp/cudnn-archive

Download cuDNN v8.5.0 (August 8th, 2022), for CUDA 11.x


5. 安装cudnn:

下载解压后,产生3个目录:

bin, include,lib.

把他们的内容copy到C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.7对应目录:

 

阅读(0) 收藏(0) 转载(0) 举报/Report
相关阅读

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有