一、深度學習為什么要搭建GPU運算環境?
熟悉深度學習的人都知道,深度學習是需要訓練的,所謂的訓練就是在成千上萬個變量中尋找最佳值的計算,所需計算的數據量異常龐大。CPU是一個有多種功能的優秀領導者。它的優點在于調度、管理、協調能力強,計算能力則位于其次。CPU的運算在遇到大體量的數據時就會耗費大量時間,而GPU相當于一個接受CPU調度的“擁有大量計算能力”的員工,用GPU運算則可以大大加快深度學習運算速度,從而減少科研的時間成本。
什么是CUDA?
CUDA(Compute Unified Device Architecture)是顯卡廠商NVIDIA推出的運算平臺。 CUDA™是一種由NVIDIA推出的通用并行計算架構,該架構使GPU能夠解決復雜的計算問題。
什么是Cudnn?
將CUDA看作是一個工作臺,上面配有很多工具,如錘子、螺絲刀等。cuDNN是基于CUDA的深度學習GPU加速庫,有了它才能在GPU上完成深度學習的計算。它就相當于工作的工具,比如它就是個扳手。但是CUDA這個工作臺買來的時候,并沒有送扳手。想要在CUDA上運行深度神經網絡,就要安裝cuDNN,這樣才能使GPU進行高速的深度神經網絡的工作。
二、搭建GPU運算環境
檢查自己的顯卡型號,選擇適合的CUDA和CUDNN
如圖打開NVIDIA控制面板–>系統信息–>找到NVCUDA.DLL
可以看到NVCUDA.DLL 后面產品名稱那一列寫著NVIDIA CUDA 10.2.95 driver,說明我的顯卡支持CUDA10.2及以下版本。
CUDA的下載
這里我選擇了CUDA 10.0版本,因為相較于最新版CUDA 10.2,版本稍低一點會相對穩定點吧!進入NVIDIA官網下載CUDA然后安裝可以了。
下圖根據提示選擇好自己的系統,系統架構,系統版本,下載方式,點擊下載的CUDA是最新的!想要下載歷史版本的話,需要自己去找,具體百度即可。
最后進入命令窗口輸入:nvcc -V查看安裝是否成功。下圖就是成功安裝的樣子。
Cudnn的下載
進入Cudnn界面–>點擊Download cuDNN
這里網站會要求你注冊一個英偉達賬號,注冊了就會跳轉去下載頁面,最后根據自己安裝的CUDA版本選擇Cudnn版本就好。我用的是Cudnn 7.6.5。
下載解壓后,把CuDNN目錄里面的bin, include, lib里面的文件覆蓋放入CUDA目錄下對應的bin,include,lib里面(注意是復制文件,而不是文件夾)。
至此GPU運算環境就算搭建完成了!
三、Ananconda3的安裝
什么是Anaconda?
Anaconda指的是一個開源的Python發行版本,其包含了conda、Python等180多個科學包及其依賴項。
Conda是一個開源的包、環境管理器,可以用于在同一個機器上安裝不同版本的軟件包及其依賴,并能夠在不同的環境之間切換。
下載Anaconda3
根據電腦系統和python版本選擇下載文件,按照安裝程序的指示進行安裝就好了。
四、Anaconda虛擬環境的搭建
什么是虛擬環境?
虛擬環境無非就是將系統的Python運行環境copy到一個指定的文件夾下,這個文件夾里的內容就是所謂的虛擬環境。你可以在這個copy出來的環境做實驗(寫你的Python代碼)而不用擔心影響到其它的項目。也就是說每個虛擬環境都是獨立的相互隔離的。
不同項目所需要的框架和python包甚至是框架和包的版本都各不相同,所以為每個項目搭建特定的虛擬環境是非常有必要的,要養成這個好習慣!
虛擬環境的相關操作
使用conda create -n your_env_name python=X.X(2.7、3.6等)
命令創建python版本為X.X、名字為your_env_name的虛擬環境。
進入虛擬環境:conda activate your_env_name
(虛擬環境名稱)
對虛擬環境中安裝額外的包:conda install -n your_env_name [package]
退出虛擬環境:deactivate
五、選擇要搭建的深度學習框架
Pytorch的安裝
進入pytorch官網,選擇自己的操作系統、編程語言、CUDA版本,最后紅圈部位會出現一行命令,復制到命令窗口就可以下載了。
但是!這種方法靈活性很低,我安裝的是CUDA 10,上圖Package里沒有這個選項怎么辦?還有PyTorch的版本在國內下載是非常非常非常慢的,而且近期清華與科大的鏡像都被封了,就導致了直接使用PyTorch官網推薦的語句很難安裝。
解決辦法是:下載安裝包到本地 。
建議大家在Package一項中選擇“pip”安裝,然后在“Run this Command”這一欄,直接復制代碼中的兩個網址,就可以下載到本地來進行安裝了。
檢查環境和GPU運算是否搭建成功
我上網了解很多人使用pytorch 1.2版本,所以沒有下載最新的1.5。
1
2
3
|
import torch print ( "hello pytorch {}" . format (torch.__version__)) device = torch.device( "cuda:0" if torch.cuda.is_available() else "cpu" ) |
Tensorflow的安裝
TensorFlow是基于VC++2015開發的,所以需要下載安裝VisualC++ Redistributable for Visual Studio 2015 來獲取MSVCP140.DLL的支持。
我這里下載了Visual Studio 2017。
然后就是好習慣時刻——創建一個虛擬環境,進入其中執行下載語句conda install tensorflow安裝就可以了!我用的是 Tensorflow 1.14.0。
五、心得和一些建議
整個深度學習環境的搭建過程是挺磨人的,我期間參考了許多博客和視頻。由于版本問題不匹配而導致環境搭好了又要推倒重來,不斷地踩坑排坑,還好結果是好的。
給一些建議:
- 在搭建GPU環境前,要了解自己的顯卡支持的CUDA版本,并且cudnn要和CUDA版本匹配。
- 無論是CUDA還是深度學習框架,盡量避免使用最新版,版本稍微低一點點就夠了,因為出了問題能找到很多同版本使用者的解決方案。
- 國內下載python包有時會很慢甚至報一些連接失敗的錯誤,換個下載方式就好了。
- 多利用虛擬環境,避免各個環境間的污染。
- 搭建好環境后,去跑一個中等大小的圖像數據集代碼吧!然后去看看你的GPU利用率是否變得很高,驗證環境確實是搭建成功了。
本文所涉及到的版本配置
- Window 10 + RTX 2060
- CUDA10.0+Cudnn 7.6.5
- Pytorch 1.2.0 +Python 3.6.5
- Tensorflow 1.14.0+Visual Studio 2017+python 3.7.3
到此這篇關于Win10 GPU運算環境搭建(CUDA10.0+Cudnn 7.6.5+pytroch1.2+tensorflow 1.14.0)的文章就介紹到這了,更多相關Win10 GPU運算環境搭建內容請搜索服務器之家以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持服務器之家!
原文鏈接:https://blog.csdn.net/weixin_43492572/article/details/106268615