[X]关闭
2

深度学习人脸识别(一)-NVIDIA driver与CUDA与CUDNN平台搭建

摘要: 从今日起,每周更新一篇,入门深度学习课程!这里的深度学习没有用到FPGA加速,使用ZYNQ的ARM进行处理,FPGA只负责摄像头数据采集。 推荐使用的开发板是MZ7XA-7020或者MZ7XB-7020,当然其他开发板也是适用的。本设计 ...

本设计建议使用以下及更高的硬件配置:

CPU:Intel Xeon(R) E5-2678 v3 @2.5GHz

GPU:NVIDIA GTX 1060 6G

Ubuntu 16.04 LTS

准备工作:

更换国内源,安装依赖包速度会有很明显的提高:

(1)备份原来的源:

sudo cp /etc/apt/sources.list /etc/apt/sources_init.list

(2)更换源:

sudo gedit /etc/apt/sources.list

(3)输入内容并保存:

deb http://mirrors.ustc.edu.cn/ubuntu/ xenial main restricted universe multiverse

deb http://mirrors.ustc.edu.cn/ubuntu/ xenial-security main restricted universe multiverse

deb http://mirrors.ustc.edu.cn/ubuntu/ xenial-updates main restricted universe multiverse

deb http://mirrors.ustc.edu.cn/ubuntu/ xenial-proposed main restricted universe multiverse

deb http://mirrors.ustc.edu.cn/ubuntu/ xenial-backports main restricted universe multiverse

deb-src http://mirrors.ustc.edu.cn/ubuntu/ xenial main restricted universe multiverse

deb-src http://mirrors.ustc.edu.cn/ubuntu/ xenial-security main restricted universe multiverse

deb-src http://mirrors.ustc.edu.cn/ubuntu/ xenial-updates main restricted universe multiverse

deb-src http://mirrors.ustc.edu.cn/ubuntu/ xenial-proposed main restricted universe multiverse

deb-src http://mirrors.ustc.edu.cn/ubuntu/ xenial-backports main restricted universe multiverse

更新:

sudo apt-get update


安装NVIDIA驱动:

(1)验证相关信息

1) 验证自己的电脑是否有一个可以支持CUDA的GPU:

lspci | grep -i nvidia

(虚拟机上无法连接显卡,需在硬盘内安装Ubuntu系统)

2) 验证自己的Linux版本是否支持 CUDA(Ubuntu 16.04没问题):

uname -m && cat /etc/*release

3) 验证系统是否安装了gcc及其版本:

gcc --version

4) 验证系统是否安装了kernel header和 package development:

a、查看正在运行的系统内核版本:在终端中输入:

uname -r

b、在终端中输入:

sudo apt-get install linux-headers-$(uname -r)

安装对应kernel版本的kernel header和package development

结果显示:“升级了 0 个软件包,新安装了 0 个软件包...”表示系统里已经有了,不用重复安装。

若以上各项验证检查均满足要求,便可进行下面的正式安装过程。如果没有满足要求的话,可以参考cuda的官方文档,里面有详细的针对每个问题的解决方案。

由于安装系统版本多种多样,安装途中可能会报有缺少依赖库等相关问题,该类问题比较简单可自行解决。

(2)下载NVIDIA驱动

在NVIDIA官网https://www.geforce.cn/drivers找到对应显卡版本的驱动(比如我的是GTX 1060 6G),在选择驱动型号前先进行一系列系统环境版本的查看

data/attachment/portal/201909/08/142844ak2m3pofkm1rg3qz.jpg

(3)禁止集成的nouveau驱动:

修改属性:

sudo chmod 666 /etc/modprobe.d/blacklist.conf

(4)使用gedit编辑黑名单列表:

sudo gedit /etc/modprobe.d/blacklist.conf

在黑名单添加如下内容,禁用相关显卡驱动:

blacklist vga16fb

blacklist nouveau

blacklist rivafb

blacklist rivatv

blacklist nvidiafb

(5)执行如下命令,更新系统,禁用nouveau:

sudo update-initramfs -u

(6)重启:

sudo reboot

(7) 重启成功后,在终端输入如下命令检查是否禁用nouveau成功,无输出,表示禁用成功:

lsmod | grep nouveau

(8)按ctrl+alt+f1进入命令行界面,在命令行界面下输入如下命令,关闭图形界面(不执行后面会出错):

 sudo service lightdm stop

卸载掉原有驱动:(若安装过其他版本或其他方式安装过驱动执行此项)

 sudo apt-get remove nvidia-* 

(9)给驱动run文件赋予执行权限:

 sudo chmod  a+x bash NVDIA-Linux-x86_64-418.56.run

(10)安装:

 sudo bash NVDIA-Linux-x86_64-418.56.run -no-opengl-files

按照窗口提示进行安装。

注:如出现ERROR:Uable to find the kernel source tree for the currently running kernel …的报错时:

sudo apt-get install linux-headers-$(uname -r)

sudo apt install dkms

重新执行sudo bash NVDIA-Linux-x86_64-418.56.run。

data/attachment/portal/201909/08/142845tzzj9pqf9zkdbpfa.jpg

yes

data/attachment/portal/201909/08/142845njsyvftjuuijjzzo.jpg

默认

data/attachment/portal/201909/08/142846pg1rr9ltvthvnqsr.jpg

no

(11)安装完毕后

输入:

nvidia-smi

打印出相关显卡信息即下载成功

输入:

nvidia-setting

激活NVIDIA显卡设置界面

安装完成


安装CUDA:

(1)运行cuda_10.1.168.418.67_linux.run(CUDA 10.1版本)

sudo bash cuda_10.1.168.418.67_linux.run -no-x-check -no-nouveau-check -no-opengl-files

安装完成后回到图形界面:

sudo service lightdm start

(2)添加环境变量:

gedit ~/.bashrc

最后一行添加:

export PATH=/usr/local/cuda-10.1/bin:$PATH

export LD_LIBRARY_PATH=/usr/local/cuda-10.1/lib64:$LD_LIBRARY_PATH


source ~/.bashrc

(3)

cd /usr/local

sudo chmod -R 777 cuda-10.1/

cd /usr/local/cuda-10.1/samples/1_Utilities/deviceQuery

make

sudo ./deviceQuery

全程无报错说明CUDA安装完成

(4)测试CUDA安装是否成功:

nvcc --version

打印出相关CUDA信息表示安装成功

查看cuda版本:

cat /usr/local/cuda-10.1/version.txt


下载CUDNN:

(1)到英伟达官网下载CUDA、Ubuntu对应版本的CUDNN:

https://developer.nvidia.com/rdp/cudnn-download

(本设计使用的cuda10.1,对应cdunn7_7.5)

中间需要注册,步骤比较简单,完成相关信息填写即可。

data/attachment/portal/201909/08/142847wg3t3n13l1vl3i3i.jpg

data/attachment/portal/201909/08/142847ohc2nmw9hppwlhzv.jpg

data/attachment/portal/201909/08/142848xllcxkz3c7x7k0l4.jpg

(2)在/usr/local路径下新建文件夹名cudNN7(版本根据自己版本设定)

将cudnn-10.1-linux-x64-v7.5.1.10.tgz放在文件夹/usr/local/cudNN7并解压:

tar zxvf cudnn-10.1-linux-x64-v7.5.1.10.tgz -C ./

(3)解压之后下载目录会产生一个cuda文件夹,然后依次输入

cd cuda/include/

sudo cp cudnn.h /usr/local/cuda/include/ #复制头文件

cd ../lib64 #打开lib64目录

sudo cp lib* /usr/local/cuda-10.1/lib64/ #复制库文件

sudo chmod a+r /usr/local/cuda-10.1/include/cudnn.h /usr/local/cuda/lib64/libcudnn* #给所有用户增加这些文件的读权限

(4)建立软连接

cd /usr/local/cuda/lib64/

sudo rm -rf libcudnn.so libcudnn.so.7

sudo ln -s libcudnn.so.7.5.1 libcudnn.so.7

sudo ln -s libcudnn.so.7 libcudnn.so

关于版本7.5.1 7根据自己下载cudnn版本决定

(5)添加环境变量

sudo vim ~/.bashrc

添加如下代码:

PATH=/usr/local/cuda-10.1/bin:$PATH

export PATH

(该步骤其实在cuda时已经完成,可以重新确认一遍)

保存退出,接下来创建链接文件,终端输入下列代码:

sudo gedit /etc/ld.so.conf.d/cuda-10-1.conf(根据自己版本号决定)

输入下面代码:

/usr/local/cuda/lib64

保存后退出

(6)更新动态链接:

sudo ldconfig

(7)cuda测试

进入CUDA 10.1Sample默认安装路径下(/home/$your desktop name)终端输入:

sudo make all -j8   #8代表8核,可以更改

完成后终端依次输入

cd bin/x86_64/linux/release

./deviceQuery

终端打印出以下信息:

data/attachment/portal/201909/08/142849hkjoigyv2igjnnql.jpg

表示安装成功!



路过

雷人

握手

鲜花

鸡蛋
发表评论

最新评论

引用 猪猪 2021-3-11 10:23
不错,感谢
引用 刘小饭 2019-9-24 14:54
电脑不支持GPU,该怎么办

查看全部评论(2)

本文作者
2019-9-6 19:47
  • 7
    粉丝
  • 8915
    阅读
  • 2
    回复

关注米联客

扫描关注,了解最新资讯

联系人:汤经理
电话:0519-80699907
EMAIL:270682667@qq.com
地址:常州溧阳市天目云谷3号楼北楼201B
相关分类
热门评论
排行榜