對于多層感知機而言,整個模型做的事情就是接收輸入生成輸出。但是并不是所有的多層神經網絡都一樣,所以為了實現復雜的神經網絡就需要神經網絡塊,塊可以描述單個層、由多個層組成的組件或整個模型本身。使用塊進行抽象的一個好處是可以將一些塊組合成更大的組件。
從編程的角度來看,塊由類(class)表示。它的任何子類都必須定義一個將其輸入轉換為輸出的正向傳播函數,并且必須存儲任何必需的參數。注意,有些塊不需要任何參數。最后,為了計算梯度,塊必須具有反向傳播函數。幸運的是,在定義我們自己的塊時,由于autograd 中引入)提供了一些后端實現,我們只需要考慮正向傳播函數和必需的參數。
這一部分我們就要自定義自己的層和塊。
先用實現一個簡單的多層感知機:
1
2
3
4
5
6
7
8
|
import torch from torch import nn from torch.nn import functional as F net = nn.Sequential(nn.Linear( 20 , 256 ), nn.ReLU(), nn.Linear( 256 , 10 )) X = torch.rand( 2 , 20 ) net(X) |
這個多層感知機包含一個具有256個單元和ReLU激活函數的全連接的隱藏層,然后是一個具有10個隱藏單元且不帶激活函數的全連接的輸出層。
通過實例化nn.Sequential來構建我們的模型,層的執行順序就是傳入參數的順序。
- nn.Sequential定義了一種特殊的Module,即在PyTorch中表示一個塊的類。它維護了一個由Module組成的有序列表(Linear類是Module的子類)。
- 正向傳播(forward)函數:將列表中的每個塊連接在一起,將每個塊的輸出作為下一個塊的輸入。
- 通過net(X)調用我們的模型來獲得模型的輸出。是net.__call__(X)的簡寫。(這一句先不管他有什么,繼續往下看。)
我們也可以自己手寫一個多層感知機:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
|
class MLP(nn.Module): def __init__( self ): # 調用`MLP`的父類的構造函數來執行必要的初始化。 # 這樣,在類實例化時也可以指定其他函數參數,例如模型參數`params`(稍后將介紹) super ().__init__() self .hidden = nn.Linear( 20 , 256 ) # 隱藏層 self .out = nn.Linear( 256 , 10 ) # 輸出層 # 定義模型的正向傳播,即如何根據輸入`X`返回所需的模型輸出 def forward( self , X): # 注意,這里我們使用ReLU的函數版本,其在nn.functional模塊中定義。 return self .out(F.relu( self .hidden(X))) net = MLP() net(X) |
通過super().__init__()調用父類的__init__函數,省去了重復編寫適用于大多數塊的模版代碼的痛苦。
實例化兩個全連接層,分別為self.hidden和self.out。
除非我們實現一個新的運算符,否則我們不用擔心反向傳播函數或參數初始化,系統將自動生成這些。
前邊說調用net() 就相當于調用net.__call__(X),因為我們在自己的MLP中寫了forward,但是我們沒有調用,只使用net() 他就自動執行forward了。就是因為會自動調用.__call__函數使forward執行。
說完后兩條說第一條:
有序是怎么實現的,構建構一個簡化的MySequential:
1
2
3
4
5
6
7
8
9
10
11
12
13
|
class MySequential(nn.Module): def __init__( self , * args): super ().__init__() for block in args: # 這里,`block`是`Module`子類的一個實例。我們把它保存在'Module'類的成員變量 # `_modules` 中。`block`的類型是OrderedDict。 self ._modules[block] = block def forward( self , X): # OrderedDict保證了按照成員添加的順序遍歷它們 for block in self ._modules.values(): X = block(X) return X |
MySequential類提供了與默認Sequential類相同的功能。
1
2
|
net = MySequential(nn.Linear( 20 , 256 ), nn.ReLU(), nn.Linear( 256 , 10 )) net(X) |
用MySequential類實現的多層感知機和Sequential類實現的一樣。
注意這里只是寫出了其執行順序,是簡化版的Sequential類!
到此這篇關于人工智能學習PyTorch教程之層和塊的文章就介紹到這了,更多相關PyTorch 層和塊內容請搜索服務器之家以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持服務器之家!
原文鏈接:https://blog.51cto.com/Lolitann/4682377