1.Anaconda下载安装 Anaconda是开源的Python发行版本,是一个包管理器和虚拟环境管理器。 进入官网下载相应版本,切换到下载文件所在目录执行以下命令。
sudo bash ***.sh(下载文件)
echo 'export PATH="/home/Jackson/anaconda3/bin:$PATH"'(添加环境变量)
source~/.bashrc(重新载入新的环境变量)
conda --verison检测是否安装成功。
若显示conda 命令未找到,则执行下面这条指令:
vim ~/.bashrc
在最后面添加 export PATH="/home/Jackson/anaconda3/bin:$PATH"
保存退出后执行 source ~/.bashrc
常用指令
conda --version(查看conda版本)
conda create -n 虚拟环境名 python=3.6(创建虚拟环境)
conda activate 虚拟环境名(激活虚拟环境)
conda deactivate(退出当前环境)
conda env list(列出虚拟环境)
conda remove -n 虚拟环境名 --all(删除虚拟环境)
conda list(列出当前环境安装的包)
conda env export > environment.yaml(将虚拟环境导出为一个YAML配置文件)
conda env create -f environment.yaml
conda create -n 虚拟环境名 --clone clone的环境名
2.安装TensorFlow
2.1安装及测试
conda --version(查看conda版本)
python --version(查看python版本)
pip install tensorflow==1.13.1(CPU版本)
#查看版本信息
import tensorflow as tf
version = tf.__version__
print(version)
pip install tensorflow-gpu==1.13.1(GPU版本) 或
pip install tensorflow-gpu==1.13.1 -i https://pypi.tuna.tsinghua.edu.cn/simple/
常用国内镜像源:
http://mirrors.aliyun.com/pypi/simple/
https://pypi.mirrors.ustc.edu.cn/simple/
http://pypi.douban.com/simple/
GPU版本需要安装cudatoolkit与cudnn包
2.2 显卡、显卡驱动、CUDA和cuDNN
显卡: 深度学习需要大量计算,GPU支持并行计算,可提高计算效率
驱动: 没有显卡驱动,就无法识别GPU硬件,也就无法调用其计算资源
CUDA:cudatoolkit是NVIDIA推出的用于自身GPU的并行计算框架,只有安装这个框架以后才能进行复杂的并行计算
cuDNN: CUDA Deep Neural Network library,是NVIDIA打造的针对深度神经网络的GPU加速库。
2.3TensorFlow版本对应python、cuDNN、CUDA
tensorflow-2.4.0 3.6-3.8 8.0 11.0
tensorflow-2.3.0 3.5-3.8 7.6 10.1
tensorflow-2.2.0 3.5-3.8 7.6 10.1
tensorflow-2.1.0 2.7,3.5-3.7 7.6 10.1
tensorflow-2.0.0 2.7,3.3-3.7 7.4 10.0
tensorflow-gpu-1.15.0 2.7,3.3-3.7 7.4 10.0
tensorflow-gpu-1.14.0 2.7,3.3-3.7 7.4 10.0
tensorflow-gpu-1.13.1 2.7,3.3-3.7 7.4 10.0
tensorflow-gpu-1.12.0 2.7,3.3-3.6 7 9
3. CUDA下载安装
3.1查看当前CUDA版本
CUDA和cuDNN版本要匹配
法1.
nvidia-smi
法2.
cd /usr/local/cuda(切换到此路径下)
ls(查看该路径下包含的文件)
cat version.txt(查看CUDA版本)
3.2安装环境检查
uname -a(显示电脑及操作系统信息)
cat /proc/version(显示运行的内核版本信息)
cat /etc/issue(显示发行版本信息)
lspci | grep -i nvidia(查看nvidia显卡信息)
gcc --version(查看gcc版本)
lsmod | grep nouveau(检查nouveau是否被禁用,无输出则被禁用,正确安装NVIDIA驱动无输出)
3.3NVIDIA驱动下载安装 去NVIDIA官网,下载所装显卡的驱动版本,驱动文件 为.run文件,然后使用如下命令安装:
sudo chmod a+x ***.run
sudo ./***.run - no-x-check -no-nouveau-check -no-opengl-files
nvidia-smi(安装完成后使用该指令查看)
3.4 CUDA和cudatoolkit
NIVDIA官方提供安装的cudatoolkit包含了进行CUDA相关程序开发的编译、调试等过程相关的所有组件。
但对于各类深度学习框架而言,如TensorFlow、Pytorch,在使用GPU时只需要动态链接库的支持即可。
例如利用Anaconda安装Pytorch时,会自动为用户安装cudatoolkit,其中包含程序调用GPU时所要依赖的库。只要系统上存在兼容的NVIDIA driver,程序就可以直接运行,不需要NVIDIA官方提供的CUDA Toolkit。
3.5CUDA下载 对于1.13.1-2.0.0版本的TensorFlow,进入官网下载CUDA10.0。
sh cuda_10.0******_linux-run
遇到下面这条指令时,表示是否要安装驱动,此时要选择n
Install NVIDIA Accelerated Graphics Driver for Linux-x86*****
安装结束后,执行以下指令配置变量:
可能会遇到下述问题:
The command could not be located because'/usr/bin' is not included in the PATH environment variable
因为当前/usr/bin的路径不在系统环境中,因此/usr/bin下的命令也无法使用,比如vi、sudo.
解决办法:
su
vim ~/.bashrc
export PATH=/usr/bin:$PATH(将/usr/bin写入环境变量)
没有上述问题则执行以下指令:
sudo gedit ~/.bashrc
export PATH="/usr/local/cuda/cuda-10.0/bin:$PATH"
export LD_LIBRARY_PATH="/usr/local/cuda/cuda-10.0/lib64:$LD_LIBRARY_PATH"
export CUDA_HOME=/usr/local/cuda/cuda10.0
命令行执行:
source ~/.bashrc(使环境变量生效)
注:修改/etc/profile里的内容,相当于系统环境变量,只需更改自己用户的环境变量配置文件(~/.bashrc)即可,多个用户之间可以保持独立性。
4.cuDNN下载安装
对于1.13.1-2.0.0版本的TensorFlow,进入官网下载cuDNN7。
打开终端输入解压指令
sudo tar -zxvf cudnn-10.0-linux-x64-v7.6.5.32.tgz -C /usr/local/cuda/include
如果文件上锁,则切换到文件所在目录执行指令:
chmod 777 cudnn.h
将库(.lib)和头文件(.h)copy到之前的cuda目录:
sudo cp /usr/local/cuda/include/cuda/include/cudnn.h /usr/local/cuda/include
sudo cp /usr/local/cuda/include/cuda/lib64/libcudnn* /usr/local/cuda/lib64
修改访问权限
sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*
检查是否安装成功
cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2
出现如下信息表示安装成功:
#define CUDNN_MAJOR 7
#define CUDNN_PATCHLEVEL 5
--
#define CUDNN_VERSION(CUDNN_MAJOR * 1000 + CUDNN_MAJOR * 100 +CUDNN_PATCHLEVEL)
#include "driver_types.h"
5.测试TensorFlow
import tensordlow as tf
show = tf.constant('What a beautiful girl!')
sess = tf.Session()
print(sess.run(show))