Ubuntu16.04LST+显卡驱动+tensorflow-GPU标准工作站安装,亲测完美!

    xiaoxiao2023-11-27  194

    Ubuntu16.04LST+tensorflow-GPU标准工作站安装

    工作站环境说明显卡驱动安装1.禁用nouveau2.安装驱动 安装CUDA安装cuDNN安装anaconda 以及tensorflow-gpu

    工作站环境说明

    系统:ubuntu16.04LST 显卡:TITAN XP ps:工作站内核最好不要更新,工作站稳定第一

    显卡驱动安装

    我的第一篇博客介绍了CUDA 以及CUDNN 以及显卡各个版本号之间的关系。有兴趣的同学可以过去看一看,我在笔记本上安装利用ppa的形式安装的,感觉更简便一点。下面附上第一篇博客的链接 第一篇博客传送门 这篇讲的是工作站的安装方式

    1.禁用nouveau

    ctrl+alt+T //打开终端 sudo gedit /etc/modprobe.d/blacklist.conf //进入系统启动黑名单

    在最后一行加入

    blacklist nouveau

    保存,然后在终端输入,更新下之前的禁用设置

    sudo update-initramfs -u 更新过后会输出 update-initramfs :Generating '.......后面的忘了

    重新启动你的电脑,进入系统后,如果你的分辨率变小(图标变大)就说明你的nouveau成功禁用了

    2.安装驱动

    博主选用的是NVIDIA-Linux-x86_64-430.09.run 关于显卡驱动的下载以及版本说明还是上一条传送门 找到你下载的显卡驱动的位置,进入终端首先更改驱动的运行权限,变为可执行文件

    shuo chmod 777 NVIDIA-Linux-x86_64-430.09.run

    777当然是代表辣个男人啦。不!当然是代表三中用户的 可执行做可读可写了!-rwxrwxrwx 然后按下ctrl+alt+F1 进入tty1

    输入你的用户名 输入你的密码

    关停图形界面

    sudo service lightdm stop

    找到你显卡驱动的位置,输入

    sudo ./NVIDIA-Linux-x86_64-430.09.run -–no-opengl-files -–no-nouveau-check ––no-x-check

    –no-opengl-files 只安装驱动文件,不安装OpenGL文件。这个参数最重要 –no-nouveau-check 安装驱动时不检查nouveau –no-x-check 安装驱动时不检查X服务 这三个博主是参考网上的解释。我安装的时候都加上了。因人而异,我们实验室另一台图站就不行 就只用了第一个才能装上 然后输入你的密码 稍等片刻即可 随后进入类似图形界面的驱动安装界面 两次左边,选择继续安装。出现安装进度条后 两次选择默认即可。安装完成后 在终端输入nvidia-smi 我们就可以看到类似下图的界面 这张图片是我上个博客的,由于之前安装的版本号是418.56.这里显示的Driver Version是418.56 再次重新启动电脑如果你的电脑分辨率恢复正常就说明我们的驱动显卡安装完成,在这当中有些小伙伴可能会出现循环登录的情况。这一点听大哥说法是–no-opengl-files –no-nouveau-check –no-x-check ,这三个参数的原因可能你的只需要加入一个–no-opengl-files ,这一点博主也不是很了解。

    安装CUDA

    去网站下载驱动 https://developer.nvidia.com/cuda-release-candidate-download 根据自己的系统下载CUDA 这里就不放图了 但是要记住 下载runfile(local)文件 下载完后找到下载CUDA文件的位置 右键打开终端 输入: 在安装CUDA的过程中会提示,CUDA10.0 设备不可用 在安装那一步 -overrid 我百度查到的结果是编译器不兼容导致的。

    sudo chmod +x cuda_10.0.130_410.48_linux.run sudo ./cuda_10.0.130_410.48_linux.run -overrid

    注意上面的数字根据自己下载的版本号更改

    **在安装CUDA的时候 注意不要安装CUDA所带的驱动 由于我们之前安装了显卡驱动了 所以不需要重复安装**

    然后就是配置环境 输入终端命令

    sudo gedit ~/.bashrc

    进入编辑模式将下面两条命令加入文档最后面:下面的序列号也需要根据自己的CUDA版本号更改

    export PATH=/usr/local/cuda-10.0/bin:$PATH export LD_LIBRARY_PATH=/usr/local/cuda-10.0/lib64:$LD_LIBRARY_PATH

    加入后在终端输入,从而使得环境生效

    source ~/.bashrc

    在终端输入,即可得到我们的CUDA信息 10.0.130

    nvcc -V

    现实如下 可见我们安装的CUDA版本为10.0.130

    maqiushuo@maqiushuo-Aspire-E5-572G:~$ nvcc -V nvcc: NVIDIA (R) Cuda compiler driver Copyright (c) 2005-2018 NVIDIA Corporation Built on Sat_Aug_25_21:08:01_CDT_2018 Cuda compilation tools, release 10.0, V10.0.130

    验证 打开终端输入

    cd /usr/local/cuda/samples/1_Utilities/deviceQuery sudo make ./deviceQuery

    得到以下结果,及说名CUDA安装成功

    安装cuDNN

    打开网站 https://developer.nvidia.com/rdp/cudnn-archive

    下载自己需要的cuDNN

    我下载的版本为 10.0 下的 cuDNN library for linux 下载完成后输入以下命令 首先进入你下载文件的文件夹 然后解压文件运行以下代码,注意 解压的文件是你下载的文件。。我这里只是提供个例子,当时下载的到底是什么名字我也忘了,所以下面代码的第一行是解压你下载的安装包.要根据你自己的cudnn版本号更改的

    tar -xzvf cudnn-10.0-linux-x64-v7.5.0.56.tgz sudo cp cuda/include/cudnn.h /usr/local/cuda/include sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64 sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*

    到这里cuDNN也已经配置完成

    安装anaconda 以及tensorflow-gpu

    1.安装anaconda

    bash Anaconda3-5.2.0-Linux-x86_64.sh

    2.在anaconda当中安装 tensorflow虚拟环境这里将其命名为tensorflow

    conda create -n tensorflow pip python=3.6

    3.激活tensorflow(之前安装的虚拟环境)

    source activate tensorflow

    4.安装tensorflow-gpu在tensorflow当中(之前安装的虚拟环境) 注意不同版本的tensorflow-gpu 对应的CUDA也是不同的 https://www.tensorflow.org/install/source 从这个网站查找对应你CUDA版本的gpu,我的电脑不能翻墙只能放一张老图 从以上对应版本号上安装对应版本的tensorflow-gpu

    pip install tensorflow-gpu == 1.13.1

    5.验证

    最新回复(0)