作者: Sam(甄峰) sam_code@hotmail.com
0. 背景介绍:
0.1:训练机介绍:
主板为技嘉B85M-D3V-A. 显卡为Nvidia GeForce RTX 1080. 使用WD 1T
硬盘和一个附加硬盘盒。
CPU:Intel(R) Core(TM) i7-7700.
0.2:Cuda安装背景:
打开Pytorch官网,看到当前版本需要CUDA11.7.
并需要安装cudnn.
所以,需求很明确:
A. 安装GeForce RTX1080 driver.
https://www.nvidia.cn/Download/index.aspx?lang=cn
B. 安装Cuda Toolkit.
https://developer.nvidia.com/cuda-11-7-0-download-archive?target_os=Windows&target_arch=x86_64&target_version=11
C. 安装cudnn.
https://developer.nvidia.com/rdp/cudnn-archive
D. 安装Python+pip.
https://www.python.org/downloads/windows/
E. 安装Pytorch.
0.3:CUDA与Nvidia Driver, 与显卡的关系:
Nvidia
driver版本和cuda版本有其对应关系,安装driver后,需要查看其最大支持的cuda版本,再行安装,否则会产生错误如下:
(base) PS C:\Program Files\NVIDIA GPU Computing
Toolkit\CUDA\v11.0\extras\demo_suite>
.\deviceQuery.exe
C:\Program Files\NVIDIA GPU Computing
Toolkit\CUDA\v11.0\extras\demo_suite\deviceQuery.exe
Starting...
CUDA Device Query (Runtime API) version
(CUDART static linking)
cudaGetDeviceCount returned 35
-> CUDA driver version is insufficient for
CUDA runtime version
Result = FAIL
这里表示driver版本与CUDA版本不匹配。
那如何知道对应关系呢? 有两个途径:
A. https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html
可以看到, CUDA11.7, 至少需要Driver 516.31.
B:
这里可以看到, Driver只有471.55. 不符合CUDA11.7.
这里可以看到,这个driver最多支持到CUDA11.4.
所以,需要升级Driver.
1.
安装Nvidia Driver和Cuda toolkit.
1.1: Nvidia driver:
https://www.nvidia.cn/Download/index.aspx?lang=cn
选中对应的driver. 1080.
选择了稳定版本Studio 驱动。
安装之。
1.2: 安装Nvidia Cuda toolkit:
既然选中了11.7. 则下载对应版本:
安装之。
此时再看Nvidia信息:
可以看到 driver:537.42.
高于CUDA11.7要求的516.31. 同时,它所支持的最高CUDA Toolkit:12.2. (注意:此处显示的此driver支持的最高Cuda
Toolkit版本,并非当前安装的Cuda ToolKit版本。)
查看信息:
可以看到,显示Cuda Toolkit版本为:11.7.
另一种验证:
此时,Sam不知如何查看Pytorch所需要的cudnn. (Paddle是直接指定对应cudnn版本的)。
于是只好先安装pytorch.
2.
安装Anaconda:
因为可能在环境中安装多个训练框架,每个训练框架依赖的Python version,
相关Package不同。所以选Anaconda.
而当前Pytorch
Windows版本支持的Python版本为: PyTorch on Windows
only supports Python 3.8-3.11
2.1:下载:
https://www.anaconda.com/download-success
选中windows对应版本。
2.2:安装:
正常安装即可。
3.
Anaconda中创建Pytorch工作环境:
打开anaconda
Prompt,
3.1:检查python版本:
python --version
显示:Python 3.11.5.
符合之前Pytorch的要求。
3.2:创建pytorch虚拟环境:
conda create -n pytorch python=3.11
此时提示需要下载N多东西,选择Y。
创建完成后,查看环境:
conda info --envs
可以看到当前除了base外,还建立了pytorch环境。
3.3:进入pytorch虚拟环境:
conda activate pytorch
4.
在Anaconda新的虚拟环境中安装Pytorch.
4.1:
Pytorch官网中说明:
conda install pytorch torchvision torchaudio
pytorch-cuda=11.7 -c pytorch -c nvidia
需要安装大量东西。
包括:pip install opencv
pip install opencv-contrib-python
尤其是opencv-contrib-python,
可以使用imshow()等。
4.2:验证:
conda list
查看pytorch是否可用:
import torch
torch.cuda.is_available()
4.3:查看cudnn version:
import torch
torch.backends.cudnn.version()
8500.
Sam认为它指出cudnn 8.5是可用的。
https://developer.nvidia.com/rdp/cudnn-archive
Download cuDNN v8.5.0 (August 8th, 2022), for
CUDA 11.x
5. 安装cudnn:
下载解压后,产生3个目录:
bin, include,lib.
把他们的内容copy到C:\Program Files\NVIDIA GPU Computing
Toolkit\CUDA\v11.7对应目录:
Win10下安装PytorchGPU版本
作者: Sam(甄峰) sam_code@hotmail.com
0. 背景介绍:
0.1:训练机介绍:
主板为技嘉B85M-D3V-A. 显卡为Nvidia GeForce RTX 1080. 使用WD 1T 硬盘和一个附加硬盘盒。
CPU:Intel(R) Core(TM) i7-7700.
0.2:Cuda安装背景:
打开Pytorch官网,看到当前版本需要CUDA11.7.
并需要安装cudnn.
所以,需求很明确:
A. 安装GeForce RTX1080 driver.
https://www.nvidia.cn/Download/index.aspx?lang=cn
B. 安装Cuda Toolkit.
https://developer.nvidia.com/cuda-11-7-0-download-archive?target_os=Windows&target_arch=x86_64&target_version=11
C. 安装cudnn.
https://developer.nvidia.com/rdp/cudnn-archive
D. 安装Python+pip.
https://www.python.org/downloads/windows/
E. 安装Pytorch.
0.3:CUDA与Nvidia Driver, 与显卡的关系:
Nvidia driver版本和cuda版本有其对应关系,安装driver后,需要查看其最大支持的cuda版本,再行安装,否则会产生错误如下:
(base) PS C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.0\extras\demo_suite> .\deviceQuery.exe
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.0\extras\demo_suite\deviceQuery.exe Starting...
CUDA Device Query (Runtime API) version (CUDART static linking)
cudaGetDeviceCount returned 35
-> CUDA driver version is insufficient for CUDA runtime version
Result = FAIL
这里表示driver版本与CUDA版本不匹配。
那如何知道对应关系呢? 有两个途径:
A. https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html
可以看到, CUDA11.7, 至少需要Driver 516.31.
B:
这里可以看到, Driver只有471.55. 不符合CUDA11.7.
这里可以看到,这个driver最多支持到CUDA11.4.
所以,需要升级Driver.
1. 安装Nvidia Driver和Cuda toolkit.
1.1: Nvidia driver:
https://www.nvidia.cn/Download/index.aspx?lang=cn
选中对应的driver. 1080. 选择了稳定版本Studio 驱动。
安装之。
1.2: 安装Nvidia Cuda toolkit:
既然选中了11.7. 则下载对应版本:
安装之。
此时再看Nvidia信息:
可以看到 driver:537.42. 高于CUDA11.7要求的516.31. 同时,它所支持的最高CUDA Toolkit:12.2. (注意:此处显示的此driver支持的最高Cuda Toolkit版本,并非当前安装的Cuda ToolKit版本。)
查看信息:
可以看到,显示Cuda Toolkit版本为:11.7.
另一种验证:
此时,Sam不知如何查看Pytorch所需要的cudnn. (Paddle是直接指定对应cudnn版本的)。 于是只好先安装pytorch.
2. 安装Anaconda:
因为可能在环境中安装多个训练框架,每个训练框架依赖的Python version, 相关Package不同。所以选Anaconda.
而当前Pytorch Windows版本支持的Python版本为: PyTorch on Windows only supports Python 3.8-3.11
2.1:下载:
https://www.anaconda.com/download-success
选中windows对应版本。
2.2:安装:
正常安装即可。
3. Anaconda中创建Pytorch工作环境:
打开anaconda Prompt,
3.1:检查python版本:
python --version
显示:Python 3.11.5.
符合之前Pytorch的要求。
3.2:创建pytorch虚拟环境:
conda create -n pytorch python=3.11
此时提示需要下载N多东西,选择Y。
创建完成后,查看环境:
conda info --envs
可以看到当前除了base外,还建立了pytorch环境。
3.3:进入pytorch虚拟环境:
conda activate pytorch
4. 在Anaconda新的虚拟环境中安装Pytorch.
4.1:
Pytorch官网中说明:
conda install pytorch torchvision torchaudio pytorch-cuda=11.7 -c pytorch -c nvidia
需要安装大量东西。
包括:pip install opencv
pip install opencv-contrib-python
尤其是opencv-contrib-python, 可以使用imshow()等。
4.2:验证:
conda list
查看pytorch是否可用:
import torch
torch.cuda.is_available()
4.3:查看cudnn version:
import torch
torch.backends.cudnn.version()
8500.
Sam认为它指出cudnn 8.5是可用的。
https://developer.nvidia.com/rdp/cudnn-archive
Download cuDNN v8.5.0 (August 8th, 2022), for CUDA 11.x
5. 安装cudnn:
下载解压后,产生3个目录:
bin, include,lib.
把他们的内容copy到C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.7对应目录: