查看: 2033|回复: 0

[windows] CUDA版本与tensorflow/pytorch不匹配(自行安装不同版本的cuda)

[复制链接]

66

主题

151

帖子

1014

积分

xdtech

Rank: 5Rank: 5

积分
1014
发表于 2020-3-8 15:59:12 | 显示全部楼层 |阅读模式
本帖最后由 易学智能 于 2020-3-19 10:54 编辑

我们使用windows GPU远程服务器进行开发时,如果在激活了conda虚拟环境后,运行程序时出现的错误提示CUDA版本与tensorflow不匹配。如下图:
cuda版本问题.png
这种情况新手可能急着去官网下载CUDA安装包,然后重头搭建环境,通常我们会看到类似下面的安装流程:
常见安装流程
  • 安装CUDA
  • 安装cuDNN
  • 配置环境变量
  • 安装gpu版的tensorflow开发包

这样一路安装下去非常耗时,而且不一定完全成功。以下提供极简版本的安装方法:

我们推荐的方式
  • 新建conda虚拟环境(建议用python3.6,可换国内源)
  • 安装AI框架时同时安装cudatoolkit包
  • 结束啦

那么,如何在安装AI框架时同时安装cudatoolkit包?
安装tensorflow(以tf2.0为例)
conda create -n py36 python=3.6
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --set show_channel_urls yes
conda install cudatoolkit tensorflow-gpu=2.0
安装pytorch(默认安装最新)
conda create -n py36 python=3.6
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --set show_channel_urls yes
conda install pytorch torchvision cudatoolkit -c pytorch

上面,我们使用了一个叫做cudatoolkit的包,相当于在conda的虚拟环境里面自动安装了CUDA。大多数时候cudatoolkit中的CUDA和cuDNN是一起安装的。这就省去了很多麻烦,比如说AI框架和CUDA的版本对应问题以及进行手动设置环境变量等等,conda会自动解决版本依赖问题。

注:安装时如果不指定tensorflow等框架版本,conda默认用最新的版本,指定版本的方式即在包后边写上版本号,比如conda install tensorflow-gpu=2.0

为了加快速度,我们在安装时使用了清华源。这招,在任何的conda install都可以用。


回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表