TensorFlow学习(五)之Ubuntu16.04配置TensorFlow———GPU版本(gtx1070+ubuntu16.01),tensorflowgtx1070


Ubuntu16.04系统安装系列:

        Ubuntu系统安装网易云音乐

         Ubuntu系统安装搜狗输入法

         Ubuntu系统安装SMPlayer播放器

         Ubuntu系统安装sublime编辑器

         Ubuntu系统安装vim编辑器

         Ubuntu系统安装labelImg

         Ubuntu常用命名大全

博主研究了下,参考了别人的博客,也出现了问题,然后解决。相信按照接下来的教程是可以很简单的安装TensorFlow-gpu的。

在开始之前,首先得了接大概步骤:1、安装显卡驱动2、安装cuda,3、安装cudnn,4、安装anaconda 5、创建虚拟TensorFlow环境并配置TensorFlow。6、测试是否成功。附加:安装一般的配件库。

注明:本文所有下载的东西博主都默认下载到了home文件夹中下载文件夹中。安装与解压时,请先cd到下载文件夹中。

1、安装显卡驱动

 在ubuntu16.04系统中选择软件更新中的附加驱动来更新驱动。具体操作:

打开系统设置。找到软件和更新,点进去出现如下界面:

然后点击附件驱动

安装图片点击即可,一定要确保已经联网:完成后点应用更改。亲测有效。

另外还有一种方法,不过前面方法已经可以解决:这个博客博客https://blog.csdn.net/qq_30520759/article/details/78947034

最后,检查显卡驱动.]

打开终端。输入以下命令

nvidia-smi 

结果如下所示。那个384.130即为你的显卡驱动的型号。 

2、 安装cuda

首先要了解的是cuda,cudnn,tensorflwo对应的TensorFlow的版本,不然就会出错。相应的版本必须要对应。linux基本对应情况如下图:

确认你要安装的cudn,cudnn,tf的版本。

博主使用的配置是:cudn9,cudnn7,tensorflow-gpu.1.8.0。

先下载cudn:cuda下载 把他下载到home文件下的下载文件夹中

 正式安装cudn:

a、进如home文件下的下载文件夹中,打开终端,输入命令

sudo sh cuda_..._linux.run   红色部分为你下载的cuda版本,即下载的cuda文件的名字

b、输入命令后,回车,进入安装。安装过程中会让你选择yes or no 。第二个选项 Install NVIDIA Accelerated Graphics Driver for Linux-x86_64 375.26? 须选择否,因为在之前已经安装好了显卡驱动,无需重新安装。具体按照下面的来选择。

Do you accept the previously read EULA?
accept/decline/quit: accept
Install NVIDIA Accelerated Graphics Driver for Linux-x86_64 375.26?
(y)es/(n)o/(q)uit: n
Install the CUDA 8.0 Toolkit?
(y)es/(n)o/(q)uit: y
Enter Toolkit Location
[ default is /usr/local/cuda-8.0 ]:  
Do you want to install a symbolic link at /usr/local/cuda?
(y)es/(n)o/(q)uit: y
Install the CUDA 8.0 Samples?
(y)es/(n)o/(q)uit: y 
Enter CUDA Samples Location
[ default is /home/dexter ]:

一路进行,完成。

c、添加环境变量

在终端输入: gedit ~/.bashrc 

然后在打开的文件最后写入:

export PATH="$PATH:/usr/local/cuda-9.0/bin"

export LD_LIBRARY_PATH="/usr/local/cuda-9cd.0/lib64"  

划重点:写入的时候,一定要确认你的cuda版本号,我这里是cuda9,则就是写入上面的命令。若是你安装的是cuda8,请把这条命令中9改为8.博主在第一次的时候就搞错了,导致一直不成功。万一和博主一样这样粗心,不要紧,在文字最后面也有解决方案。

保存并关闭文件,然后在终端输入:source ~/.bashrc

如此使得环境更改生效。

d、cuda测试:

打开终端,切换到位置:~/ NVIDIA_CUDA-9.0_Samples         (同样,你安装的是什么版本的cuda,就切换到那个文件夹中)
        命令行输入:make   (此步编译时间很长,有可能你会看到光标不动,不用理,因为确实要很久)
        打开终端,切换到位置:~/NVIDIA_CUDA-9.0_Samples/bin/x86_64/linux/release
        终端输入:./deviceQuery     

     如果显示类似下图,则说明CUDA安装且配置成功!

 

 3、cudnn安装

cudnn安装就较简单了,基本上就是解压,然后复制到具体文件夹中。具体如下:

首先下载cudnn:cudnn下载

进入下载文件中,打开终端输入以下四条命令。输入一条命令后按回车,接着输入吓一跳命令:

    tar xvzf cudnn-9.0-...tgz        (红色部分为你下载的cudann版本,即下载的cudann文件的名字)

    sudo cp cuda/include/cudnn.h /usr/local/cuda-9.0/include
    sudo cp cuda/lib64/libcudnn* /usr/local/cuda-9.0/lib64
    sudo chmod a+r /usr/local/cuda-9.0/include/cudnn.h /usr/local/cuda-9.0/lib64/libcudnn*

重点:一定要把9变成你所要安装的cuda版本。博主是cuda9。或者直接手动输入就不会错。

相当于解压缩+复制粘贴,手动复制粘贴也是没问题的。到此cuDNN安装完毕。

4、安装anaconda

a、下载anaconda.  链接

下载如下版本。

 b、安装

进入annaconda下载的文件夹中,打开终端,输如命令:bash Anaconda...Linux-x86_64.sh   (红色部分为下载的anaconda版本文件名)
 c、安装时,出现让你选择yes or no ,则选yes。就会自动配置文件,可是有的时候你选择yes会一直显示说让你retry,说明这样就是配置不成功。则需要手动配置,如下:
       配置文件: 将anaconda的bin目录加入PATH,根据版本不同,也可能是~/anaconda3/bin
          输入命令:  sudo gedit ~/.bashrc 

         接着就会自动打开一个文件
        export PATH="$PATH:~/anaconda3/bin"    将此句填在bashrc文件末尾中,然后保存后关闭。
        在输入命令: source ~/.bashrc     使得更改配置生效

d:若是要卸载anaconda

参考:https://blog.csdn.net/qq_22474567/article/details/54984257
        (1)删除整个anaconda目录: rm -rf anaconda文件夹名
        (2)清理下.bashrc中的Anaconda路径:
            1.到根目录下,打开终端并输入:sudo gedit ~/.bashrc
             2.在.bashrc文件末尾用#号注释掉之前添加的路径(或直接删除):
                      #export PATH=/home/lq/anaconda3/bin:$PATH
                  保存并关闭文件
              3.使其立即生效,在终端执行:source ~/.bashrc
             4.关闭终端,然后再重启一个新的终端

 5、创建虚拟TensorFlow环境并配置TensorFlow

a、使用conda指令创建虚拟环境

               创建环境:打开终端,输入命令:conda create --name tf python=3.6     (注:tf是虚拟环境的名字,可以随便取。3.6是你要安装的Python版本,也可以指定)

             环境创建完,就要激活环境:输入命令:source activate tf

            附加:若要退出环境:则输入:source deactivate

                    若需要删除环境:conda remove -n tf --all

b、TensorFlow-gpu安装

   激活环境后,在tf环境中,输入如下命令中的任何一种命令即可:

        conda install -c jjhelmus tensorflow-gpu  (此版本可能较低,安装后可能需要升级)
        conda install -c jjhelmus/label/tflow_180 tensorflow-gpu  (此版本是TensorFlow-gpu1.8.0版本,博主就是这个版本,推荐)
        conda install -c jjhelmus/label/tflow_110_testing tensorflow-gpu

 

至此,所有配置已经完成,可以跳到第六步去试试是否正确。

还推荐一些其他的库:

        安装keras:pip install keras
        安装opencv3:conda install -c https://conda.anaconda.org/menpo opencv3

6、测试是否成功

官网上的测试程序。对一个线性数据进行训练的demo。

打开终端,激活环境后,输入命令:vi test.py

把代码复制进去:

import tensorflow as tf
import numpy as np

# Create 100 phony x, y data points in NumPy, y = x * 0.1 + 0.3
x_data = np.random.rand(100).astype(np.float32)
y_data = x_data * 0.1 + 0.3

# Try to find values for W and b that compute y_data = W * x_data + b
# (We know that W should be 0.1 and b 0.3, but TensorFlow will
# figure that out for us.)
W = tf.Variable(tf.random_uniform([1], -1.0, 1.0))
b = tf.Variable(tf.zeros([1]))
y = W * x_data + b

# Minimize the mean squared errors.
loss = tf.reduce_mean(tf.square(y - y_data))
optimizer = tf.train.GradientDescentOptimizer(0.5)
train = optimizer.minimize(loss)

# Before starting, initialize the variables.  We will 'run' this first.
init = tf.initialize_all_variables()

# Launch the graph.
sess = tf.Session()
sess.run(init)

# Fit the line.
for step in range(201):
    sess.run(train)
    if step % 20 == 0:
        print(step, sess.run(W), sess.run(b))

# Learns best fit is W: [0.1], b: [0.3]

保存退出后。输入命令:python test.py

出现如下界面即成功

成功,可以尽情嗨皮在TensorFlow的海洋里了。

 

最后彩蛋:既然安装了anaconda,顺便也安装下 spyder IDE。还有很常用的jupyter notebook.

打开终端,激活tf环境,输入命令:

            conda install spyder
            conda install jupyter notebook

如此就都安装了。打开这些直接在输入命令  spyder   回车既可以打开。

备注:若是最后出现说CUDA driver version is insufficient for CUDA runtime version。

这个问题一个解决办法是显卡驱动有问题,还有一个种可能,就是你在安装的时候,安装错了版本,比如,你想安装cuda9,可是你在配置的时候因为复制别人的代码(别人代码上写着cuda8),导致你下载的cuda版本,与你配置环境的cuda版本不同。

解决办法:去本博第二步C步骤那,打开那个文件,把版本号改成与你下载的cuda版本相同。然后重新编译,就是需要重新进行第二步中的c,d两步,然后卸载配置的虚拟TensorFlow环境,重新配置环境。其他的不用动。

 

 

 

 

 

相关内容

    暂无相关文章