前言
Python 中的 for 循環(huán)和其他語言中的 for 循環(huán)工作方式是不一樣的,今天就帶你深入了解 Python 的 for 循環(huán),看看它是如何工作的,以及它為什么按照這種方式工作。
循環(huán)中的陷阱
我們先來看一下 Python 循環(huán)中的「陷阱」,在我們了解了循環(huán)的工作方式后,再來看下這些陷阱到底是怎么出現(xiàn)的。
陷阱 1:循環(huán)兩次
現(xiàn)在我們先假設(shè)有一個數(shù)字組成的列表,和一個用于返回這些數(shù)字的平方的生成器:
1
2
|
>>> nums = [ 1 , 2 , 3 , 4 ] >>> squares = (n * * 2 for n in nums) |
我們可以將這個生成器對象傳遞給元組構(gòu)造器,從而可以得到一個元組:
1
2
|
>>> tuple (squares) ( 1 , 4 , 9 , 16 ) |
這個時候,如果我們再將這個構(gòu)造器對象傳遞給 sum 函數(shù),按理說應(yīng)該會返回這些數(shù)字的和吧:
1
2
|
>>> sum (squares) 0 |
返回的是個 0,先拖住下巴。
陷阱 2:檢查是否包含
我們還是使用上面的數(shù)字列表和生成器:
1
2
|
>>> nums = [ 1 , 2 , 3 , 4 ] >>> squares = (n * * 2 for n in nums) |
如果我 squares 生成器中是否包含 9,答案是肯定的,若果我再問一次呢?
你敢答應(yīng)嗎
1
2
3
4
|
>>> 9 in squares True >>> 9 in squares False |
發(fā)現(xiàn),第二次不靈了~
怎么不靈了
陷阱 3:拆包
現(xiàn)在假設(shè)有一個字典:
1
|
>>> counts = { 1 : 'a' , 2 : 'b' } |
然后,我們用多個變量對字典進(jìn)行拆包:
1
|
>>> x,y = counts |
你覺得這時候,x 和 y 中會是什么?
1
2
3
4
|
>>> x 1 >>> y 2 |
我們只得到了鍵。
下面,我們先來了解下 Python 中的循環(huán)工作原理,然后再反過頭來看這些陷阱問題。
一些概念
首先,先了解一些基本概念:
可迭代和序列
可迭代就是指任意可以使用 for 循環(huán)遍歷的東西,可迭代意味著可以遍歷,任何可以遍歷的東西都是可迭代的。
1
2
|
for item in some_iterable: print (item) |
序列是一種常見的可迭代類型,如列表、元組、字符串等。
序列是可迭代的,它有著一些特點(diǎn),它們是從 0 開始索引,索引長度不超過序列的長度;它們有序列長度;并且它們可以被切分。
Python 中的大部分東西都是可以迭代的,但是可以迭代并不意味著它是序列。如集合、字典、文件和生成器都是可迭代的,但是它們都不是序列。
1
2
3
4
|
>>> my_set = { 1 , 2 , 3 } >>> my_dict = { 'k1' : 'v1' , 'k2' : 'v2' } >>> my_file = open ( 'some_file.txt' ) >>> squares = (n * * 2 for n in my_set) |
總結(jié)下來就是,任何可以用 for 循環(huán)遍歷的東西都是可迭代的,序列可迭代的類型中的一種,Python 還有著許多其他種類的可迭代類型。
迭代器
迭代器就是可以驅(qū)動可迭代對象的東西。你可以從任何可迭代對象中獲得迭代器,你也可以使用迭代器來手動對它的迭代進(jìn)行遍歷。
下面有三個可迭代對象:一個集合、一個元祖和一個字符串:
1
2
3
|
>>> nums = { 1 , 2 , 3 , 4 } >>> coors = ( 4 , 5 , 6 ) >>> words = "hello hoxis" |
我們可以使用 Python 的內(nèi)置函數(shù) iter ,從這些可迭代對象中獲取到迭代器:
1
2
3
4
5
6
|
>>> iter (nums) <setiterator object at 0x7fa8c194ad70 > >>> iter (coors) <tupleiterator object at 0x7fa8c1959610 > >>> iter (words) <iterator object at 0x7fa8c19595d0 > |
一旦我們有了迭代器,我們就可以使用其內(nèi)置函數(shù) next() 來獲取它的下一個值:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
|
>>> nums = { 1 , 2 , 3 , 4 } >>> num_iter = iter (nums) >>> next (num_iter) 1 >>> next (num_iter) 2 >>> next (num_iter) 3 >>> next (num_iter) 4 >>> next (num_iter) Traceback (most recent call last): File "<stdin>" , line 1 , in <module> StopIteration |
若果迭代到頭了,也就是沒有下一個值了,就會拋出 StopIteration 異常。也就是說,它不會繼續(xù)循環(huán)取獲取第一個值。
是不是有點(diǎn)懵逼了?
- 可迭代對象是可以迭代的東西
- 迭代對象器實際上是遍歷可迭代對象的代理
- 迭代器沒有長度,它們不能被索引。
- 可以使用迭代器來做的唯一有用的事情是將其傳遞給內(nèi)置的 next 函數(shù),或者對其進(jìn)行循環(huán)遍歷
- 可以使用 list() 函數(shù)將迭代器轉(zhuǎn)換為列表
1
2
3
4
5
6
7
8
|
>>> nums = { 1 , 2 , 3 , 4 } >>> num_iter = iter (nums) >>> next (num_iter) 1 >>> list (num_iter) [ 2 , 3 , 4 ] >>> list (num_iter) [] |
若果想再次將其轉(zhuǎn)換為列表,明顯地,得到的是一個空列表。
其實這也是迭代器的一個重要特性:惰性,只能使用一次,只能循環(huán)遍歷一次。并且,在我們調(diào)用 next() 函數(shù)之前,它不會做任何事情。因此,我們可以創(chuàng)建無限長的迭代器,而創(chuàng)建無限長的列表則不行,那樣會耗盡你的內(nèi)存!
可迭代對象不一定是迭代器,但是迭代器一定是可迭代的:
對象 | 可迭代? | 迭代器? |
---|---|---|
可迭代對象 | √ | 不一定 |
迭代器 | √ | √ |
生成器 | √ | √ |
列表 | √ | × |
其實,Python 中有許多迭代器,生成器是迭代器,Python 的許多內(nèi)置類型也是迭代器。例如,Python 的 enumerate 和 reversed 對象就是迭代器。zip, map 和 filter 也是迭代器;文件對象也是迭代器。
Python 中的 for 循環(huán)
其實,Python 并沒有傳統(tǒng)的 for 循環(huán),什么是傳統(tǒng)的 for 循環(huán)?
我們看下 Java 中的 for 循環(huán):
1
2
3
4
5
|
int [] integers = { 1 , 2 , 3 , 4 }; for ( int j = 0 ; j<integers.length; j + + ) { int i = integers[j]; System.out.println(i); } |
這是一種 C風(fēng)格 的 for 循環(huán),JavaScript、C、C++、Java、PHP 和一大堆其他編程語言都有這種風(fēng)格的 for 循環(huán),但是 Python 確實沒有。
Python 中的我們稱之為 for 循環(huán)的東西,確切的說應(yīng)該是 foreach 循環(huán):
1
2
3
|
numbers = [ 1 , 2 , 3 , 5 , 7 ] for n in numbers: print (n) |
和 C風(fēng)格 的 for 循環(huán)不同之處在于,Python 的 for 循環(huán)沒有索引變量,沒有索引變量的初始化,邊界檢查和索引變量的增長。
這就是 Python 的 for 循環(huán)的不同之處!
使用索引?
你可能會懷疑,Python 的 for 循環(huán)是否在底層使用了索引,下面我們手動的使用 while 循環(huán)和索引來遍歷:
1
2
3
4
5
6
7
8
9
10
|
>>> nums = [ 1 , 2 , 3 , 4 ] >>> i = 0 >>> while i < len (nums): ... print (num[i]) ... i + = 1 ... 0 1 2 3 |
對于列表,這樣遍歷是可以的,但不代表適用于所有可迭代對象,它只適用于序列。
比如,我們對一個 set 使用這種方法遍歷,會得到一個異常:
1
2
3
4
5
6
7
8
9
|
>>> set = { 1 , 2 , 3 } >>> i = 0 >>> while i < len ( set ): ... print ( set [i]) ... i + = 1 ... Traceback (most recent call last): File "<stdin>" , line 2 , in <module> TypeError: 'set' object does not support indexing |
因為 set 不是序列,因此不支持索引遍歷。
我們不能使用索引手動對 Python 中的每一個迭代對象進(jìn)行遍歷。對于那些不是序列的迭代器來說,更是行不通的。
實現(xiàn)沒有 for 的循環(huán)
從上文可以看出,Python 中的 for 循環(huán)不使用索引,它使用的是迭代器。讓我們來看下它是如何工作的。
通過上文,我們了解到了迭代器和 iter、next 函數(shù),現(xiàn)在我們可以嘗試不用 for 循環(huán)來遍歷一個可迭代對象。
下面是一個正常的 for 循環(huán):
1
2
3
|
def funky_for_loop(iterable, action_to_do): for item in iterable: action_to_do(item) |
我們要嘗試用迭代器的方法和 while 實現(xiàn)上面 for 循環(huán)的邏輯,大致步驟如下:
- 獲取給定可迭代對象的迭代器;
- 調(diào)用迭代器的 next() 方法獲取下一項;
- 對當(dāng)前項數(shù)據(jù)進(jìn)行處理;
- 如果捕獲到 StopIteration ,那么就停止循環(huán)
1
2
3
4
5
6
7
8
9
|
def funky_for_loop(iterable, action_to_do): iterator = iter (iterable) while not done_looping: try : item = next (iterator) except StopIteration: break else : action_to_do(item) |
Python 底層的循環(huán)工作方式基本上如上代碼,就是迭代器驅(qū)動的 for 循環(huán)。
再次回到循環(huán)陷阱
陷阱 1:耗盡的迭代器
陷阱 1 中,因為生成器是迭代器,迭代器是惰性的,也是一次性的,在已經(jīng)遍歷過一次的情況下,再對其求和,返回的就是一個 0。
陷阱 2:部分消耗迭代器
陷阱 2 中,我們兩次詢問 9 是否存在于同一個生成器中,得到了不同的答案。
這是因為,第一次詢問時,Python 已經(jīng)對這個生成器進(jìn)行了遍歷,也就是調(diào)用 next() 函數(shù)查找 9,找到后就會返回 True,第二次再詢問 9 是否存在時,會從上次的位置繼續(xù) next() 查找。
1
2
3
4
5
6
7
|
>>> nums = [ 1 , 2 , 3 , 4 , 5 ] >>> squares = (n * * 2 for n in nums) >>> 9 in squares True # 此時打印出來 >>> list (squares) [ 16 , 25 ] |
陷阱 3:拆包是迭代
當(dāng)直接在字典上迭代時,得到的是鍵:
1
2
3
4
5
6
|
>>> counts = { 1 : 'a' , 2 : 'b' } >>> for i in counts: ... print (i) ... 1 2 |
而對字典拆包時,和在字典上遍歷是一樣的,都是依賴于迭代器協(xié)議,因此得到的也是鍵。
總結(jié)
序列是迭代器,但是不是所有的迭代器都是序列。迭代器不可以被循環(huán)遍歷兩次、不能訪問其長度,也不能使用索引。
迭代器是 Python 中最基本的可迭代形式。如果你想在代碼中做一個惰性迭代,請考慮迭代器,并考慮使用生成器函數(shù)或生成器表達(dá)式。
最后,請記住,Python 中的每一種迭代都依賴于迭代器協(xié)議,因此理解迭代器協(xié)議是理解 Python 中的循環(huán)的關(guān)鍵。
原文鏈接:https://opensource.com/article/18/3/loop-better-deeper-look-iteration-python
好了以上就是這篇文章的全部內(nèi)容了,希望本文的內(nèi)容對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,如果有疑問大家可以留言交流,謝謝大家對服務(wù)器之家的支持。
原文鏈接:https://www.jianshu.com/p/6f66aeeb0093