0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

什么是迭代器?我們?yōu)槭裁匆褂玫鳎?/h1>

導(dǎo)語(yǔ):之前說(shuō)過(guò),我對(duì)于編程語(yǔ)言跟其它學(xué)科的融合非常感興趣,但我還說(shuō)漏了一點(diǎn),就是我對(duì)于 Python 跟其它編程語(yǔ)言的對(duì)比學(xué)習(xí),也很感興趣。所以,我一直希望能聚集一些有其它語(yǔ)言基礎(chǔ)的同學(xué),一起討論共通的語(yǔ)言特性間的話題。不同語(yǔ)言的碰撞,常常能帶給人更高維的視角,也能觸及到語(yǔ)言的根基,這個(gè)過(guò)程是極有益的。

0 前言

迭代器(Iterator)是 Python 以及其他各種編程語(yǔ)言中的一個(gè)非常常見(jiàn)且重要,但又充滿著神秘感的概念。無(wú)論是 Python 的基礎(chǔ)內(nèi)置函數(shù),還是各類高級(jí)話題,都處處可見(jiàn)迭代器的身影。

那么,迭代器究竟是怎樣的一個(gè)概念?其又為什么會(huì)廣泛存在于各種編程語(yǔ)言中?本文將基于 C++ 與 Python,深入討論這一系列問(wèn)題。

1 什么是迭代器?我們?yōu)槭裁匆褂玫鳎?/p>

什么是迭代器?當(dāng)我初學(xué) Python 的時(shí)候,我將迭代器理解為一種能夠放在“for xxx in …”的“…”位置的東西;后來(lái)隨著學(xué)習(xí)的深入,我了解到迭代器就是一種實(shí)現(xiàn)了迭代器協(xié)議的對(duì)象;學(xué)習(xí) C++ 時(shí),我了解到迭代器是一種行為和指針類似的對(duì)象…

事實(shí)上,迭代器是一個(gè)伴隨著迭代器模式(Iterator Pattern)而生的抽象概念,其目的是分離并統(tǒng)一不同的數(shù)據(jù)結(jié)構(gòu)訪問(wèn)其中數(shù)據(jù)的方式,從而使得各種需要訪問(wèn)數(shù)據(jù)結(jié)構(gòu)的函數(shù),對(duì)于不同的數(shù)據(jù)結(jié)構(gòu)可以保持相同的接口

在很多討論 Python 迭代器的書(shū)籍與文章中,我看到這樣兩種觀點(diǎn):1. 迭代器是為了節(jié)約數(shù)據(jù)結(jié)構(gòu)所產(chǎn)生的內(nèi)存;2. 遍歷迭代器效率更高。

這兩點(diǎn)論斷都是很不準(zhǔn)確的:首先,除了某些不定義在數(shù)據(jù)結(jié)構(gòu)上的迭代器(如文件句柄,itertools 模塊的 count、cycle 等無(wú)限迭代器等),其他迭代器都定義在某種數(shù)據(jù)結(jié)構(gòu)上,所以不存在節(jié)約內(nèi)存的優(yōu)勢(shì);其次,由于迭代器是一種高度泛化的實(shí)現(xiàn),其需要在每一次迭代器移動(dòng)時(shí)都做一些額外工作(如 Python 需要不斷檢測(cè)迭代器是否耗盡,并進(jìn)行異常監(jiān)測(cè);C++ 的 deque 容器需要對(duì)其在堆上用于存儲(chǔ)的多段不連續(xù)內(nèi)存進(jìn)行銜接等),故遍歷迭代器的效率一定低于或幾乎接近于直接遍歷容器,而不太可能高于直接遍歷原容器。

綜上所述,迭代器存在的意義,不是為了空間換時(shí)間,也不是為了時(shí)間換空間,而是一種適配器(Adapter)。迭代器的存在,使得我們可以使用同樣的 for 語(yǔ)句去遍歷各種容器,或是像 C++ 的 algorithm 模塊所示的那樣,使用同樣的接口去處理各種容器。

這些容器可以是一個(gè)連續(xù)內(nèi)存的數(shù)組或列表,或是一個(gè)多段連續(xù)內(nèi)存的 deque,甚至是一個(gè)完全不連續(xù)內(nèi)存的鏈表或是哈希表等等,我們完全不需要關(guān)注迭代器對(duì)于不同的容器究竟是怎么取得數(shù)據(jù)的。

2 C++中的迭代器

2.1 泛化指針

在 C++ 中,迭代器通過(guò)泛化指針(Generalized Pointer)的形式呈現(xiàn)。泛化指針與仿函數(shù)(Functor)的定義類似,其包含以下兩種情況:

是一個(gè)真正的指針

不是指針,但重載了某些指針運(yùn)算符(如“*,++,--,!=” 等),使得其行為和指針相似

根據(jù)泛化指針為了將其“偽裝”成一個(gè)真正的指針從而重載的運(yùn)算符的數(shù)量,迭代器被分為五種,如下文所示。

2.2 C++的迭代器分類

C++ 的迭代器按其所支持的行為被分為五類:

輸入迭代器(Input Iterator):僅可作為右值(rvalue),不可作為左值(lvalue)??梢赃M(jìn)行比較(“== 與 !=”)

輸出迭代器(Output Iterator):僅可作為左值,不可作為右值

前向迭代器(Forward Iterator):支持一切輸入迭代器的操作,以及單步前進(jìn)操作(++)

雙向迭代器(Bidirectional Iterator):支持一切前向迭代器的操作,以及單步后退操作(--)

隨機(jī)訪問(wèn)迭代器(Random Access Iterator):支持一切雙向迭代器操作,以及非單步雙向移動(dòng)操作

對(duì)于前向迭代器,雙向迭代器,以及隨機(jī)訪問(wèn)迭代器,如果其不存在底層 const(Low-Level Const)限定,則同時(shí)也支持一切輸出迭代器操作。

2.3 迭代器適配器

C++ 中還存在一系列迭代器適配器,用于使得一些非迭代器對(duì)象的行為類似于迭代器,或修改迭代器的一些默認(rèn)行為,大致包含如下幾個(gè)類別:

插入迭代器(Insert Iterator):使得對(duì)迭代器左值的寫(xiě)入操作變?yōu)橄蛉萜髦胁迦霐?shù)據(jù)的操作,按插入位置的不同,可分為 front_insert_iterator,back_insert_iterator 和 insert_iterator

反向迭代器(Reverse Iterator):對(duì)調(diào)迭代器的移動(dòng)方向。使得“+”操作變?yōu)橄蜃笠苿?dòng),同時(shí)“-”操作變?yōu)橄蛴乙苿?dòng)(類似于 Python 的 reversed 函數(shù))

移動(dòng)迭代器(Move Iterator):使得對(duì)迭代器的取值變?yōu)橛抑狄茫≧value Reference)

流迭代器(Stream Iterator):使流對(duì)象的行為適配迭代器(類似于 Python 的文件句柄)

3 Python中的迭代器

3.1 迭代器協(xié)議

在 Python 中,迭代器基于鴨子類型(Duck Type)下的迭代器協(xié)議(Iterator Protocol)實(shí)現(xiàn)。迭代器協(xié)議規(guī)定:如果一個(gè)類想要成為可迭代對(duì)象(Iterable Object),則其必須實(shí)現(xiàn)__iter__方法,且其返回值需要是一個(gè)實(shí)現(xiàn)了__next__方法的對(duì)象。

即:實(shí)現(xiàn)了__iter__方法的類將成為可迭代對(duì)象,而實(shí)現(xiàn)了__next__方法的類將成為迭代器。

顯然,__iter__方法是 iter 函數(shù)所對(duì)應(yīng)的魔法方法,__next__方法是 next 函數(shù)所對(duì)應(yīng)的魔法方法。

對(duì)于一個(gè)可迭代對(duì)象,針對(duì)“誰(shuí)實(shí)現(xiàn)了__next__方法?”這一問(wèn)題進(jìn)行討論,可將可迭代對(duì)象的實(shí)現(xiàn)分為兩種情況:

self 未實(shí)現(xiàn)__next__:如果__iter__方法的返回值就是一個(gè) Iterator,則此時(shí) self 即為一個(gè)可迭代對(duì)象。此時(shí),self 將迭代操作“委托”到了另一個(gè)數(shù)據(jù)結(jié)構(gòu)上。示例代碼如下:

classSampleIterator:def__iter__(self):returniter(...)

self 實(shí)現(xiàn)了__next__:如果__iter__方法返回 self,則說(shuō)明 self 本身將作為迭代器,此時(shí) self 本身需要繼續(xù)實(shí)現(xiàn)__next__方法,以實(shí)現(xiàn)完整的迭代器協(xié)議。示例代碼如下:

classSampleIterator:def__iter__(self):returnselfdef__next__(self):#NotTheEndif...:return...#ReachTheEndelse:raiseStopIteration

此例可以看出,當(dāng)?shù)鹘K止時(shí),通過(guò)拋出 StopIteration 異常告知 Python 迭代器已耗盡。

3.2 生成器

生成器(Generator)是 Python 特有的一組特殊語(yǔ)法,其主要目的為提供一個(gè)基于函數(shù)而不是類的迭代器定義方式。同時(shí),Python 也具有生成器推導(dǎo)式,其基于推導(dǎo)式語(yǔ)法快速建立迭代器。生成器一般適用于需要?jiǎng)?chuàng)建簡(jiǎn)單邏輯的迭代器的場(chǎng)合。

只要一個(gè)函數(shù)的定義中出現(xiàn)了 yield 關(guān)鍵詞,則此函數(shù)將不再是一個(gè)函數(shù),而成為一個(gè)“生成器構(gòu)造函數(shù)”,調(diào)用此構(gòu)造函數(shù)即可產(chǎn)生一個(gè)生成器對(duì)象。

由此可見(jiàn),如果僅討論該語(yǔ)法本身,而不關(guān)心實(shí)現(xiàn)的話:生成器只是“借用”了函數(shù)定義的語(yǔ)法,實(shí)際上與函數(shù)并無(wú)關(guān)系(并不代表生成器的底層實(shí)現(xiàn)也與函數(shù)無(wú)關(guān))。示例代碼如下:

defSampleGenerator():yield...yield...yield...

生成器推導(dǎo)式則更為簡(jiǎn)單,只需要將列表推導(dǎo)式的中括號(hào)換為小括號(hào)即可:

(...for...in...)

綜上所述,生成器是 Python 獨(dú)有的一類迭代器的特殊構(gòu)造方式。生成器一旦被構(gòu)造,其會(huì)自動(dòng)實(shí)現(xiàn)完整的迭代器協(xié)議。

3.3 無(wú)限迭代器

itertools 模塊中實(shí)現(xiàn)了三個(gè)特殊的無(wú)限迭代器(Infinite Iterator):count,cycle 以及 repeat,其有別于普通的表示范圍的迭代器。如果對(duì)無(wú)限迭代器進(jìn)行迭代將導(dǎo)致無(wú)限循環(huán),故無(wú)限迭代器通常只可使用 next 函數(shù)進(jìn)行取值。

3.4 與C++迭代器的比較

經(jīng)過(guò)上文的討論可以發(fā)現(xiàn),Python 只有一種迭代器,此種迭代器只能進(jìn)行單向,單步前進(jìn)操作,且不可作為左值。故 Python 的迭代器在 C++ 中應(yīng)屬于單向只讀迭代器,這是一種很低級(jí)的迭代器。

此外,由于迭代器只支持單向移動(dòng),故一旦向前移動(dòng)便不可回頭,如果遍歷一個(gè)已耗盡迭代器,則 for 循環(huán)將直接退出,且無(wú)任何錯(cuò)誤產(chǎn)生,此種行為往往會(huì)產(chǎn)生一些難以察覺(jué)的 bug,實(shí)際使用時(shí)請(qǐng)務(wù)必注意。

綜上所述,Python 對(duì)于迭代器的實(shí)現(xiàn)其實(shí)是高度匱乏的,應(yīng)謹(jǐn)慎使用。

4 迭代器有效性

4.1 什么是迭代器有效性?

由于迭代器本身并不是獨(dú)立的數(shù)據(jù)結(jié)構(gòu),而是指向其他數(shù)據(jù)結(jié)構(gòu)中的值的泛化指針,故和普通指針一樣,一旦指針指向的內(nèi)存發(fā)生變動(dòng),則迭代器也將隨之失效。

如果迭代器指向的數(shù)據(jù)結(jié)構(gòu)是只讀的,則顯然,直到析構(gòu)函數(shù)被調(diào)用,迭代器都不會(huì)失效。但如果迭代器所指向的數(shù)據(jù)結(jié)構(gòu)在其存在時(shí)發(fā)生了插入或刪除操作,則迭代器將可能失效。故討論某個(gè)操作是否會(huì)導(dǎo)致指向容器的迭代器失效,是一個(gè)很重要的話題。

4.2 C++的迭代器有效性

由于 Python 中沒(méi)有 C++ 的 list、deque 等數(shù)據(jù)結(jié)構(gòu)實(shí)現(xiàn),故本文只簡(jiǎn)單地討論 vector 與 unordered_map 這兩種數(shù)據(jù)結(jié)構(gòu)的迭代器有效性。

對(duì)于 vector,由于其存在內(nèi)存擴(kuò)容與轉(zhuǎn)移操作,故任何會(huì)潛在導(dǎo)致內(nèi)存擴(kuò)容的方法都將損壞迭代器,包括 push_back、emplace_back、insert、emplace 等。

unordered_map 與 vector 的情形類似,對(duì) unordered_map 進(jìn)行任何插入操作也將損壞迭代器。

4.3 Python的迭代器有效性

注:本節(jié)所討論全部?jī)?nèi)容均基于實(shí)際行為進(jìn)行猜想和推論,并沒(méi)有經(jīng)過(guò)對(duì) Python 源代碼的考察和驗(yàn)證,僅供讀者參考。

4.3.1 尾插入操作不會(huì)損壞指向當(dāng)前元素的List迭代器

考察如下代碼:

numList=[1,2,3]numListIter=iter(numList)next(numListIter)foriinrange(1000000):numList.append(i)#print2print(next(numListIter))

如果在 C++ 中對(duì)一個(gè) vector 執(zhí)行這么多次的 push_back,則指向第二個(gè)元素的迭代器一定早已失效。但在 Python 中可以看到,指向 List 的迭代器并未失效,其仍然返回了 2。

故可猜想:Python 對(duì)于 List 所產(chǎn)生的迭代器并不跟蹤指向 List 元素的指針,而僅僅跟蹤的是容器的索引值。

4.3.2 尾插入操作會(huì)損壞List尾迭代器

numList=[1,2]numListIter=iter(numList)#1next(numList)numList.append(3)#2next(numListIter)#3print(next(numListIter))

首先,Python 不存在尾迭代器這一概念。但由上述代碼可知,當(dāng)?shù)魉赶虻?List 變長(zhǎng)后,迭代器的終止點(diǎn)也隨之變化,即:原先的尾迭代器將不再適用。

按照“迭代器僅跟蹤元素索引值”這一推斷,也能解釋這一行為。

4.3.3 迭代器一旦耗盡,則將永久損壞

考察如下代碼:

numList=[1,2]numListIter=iter(numList)for_innumListIter:passnumList.append(3)#StopIterationprint(next(numListIter))

當(dāng) for 一個(gè)迭代器后,迭代器將耗盡,在 C++ 中,這將導(dǎo)致頭尾迭代器相等,但由上述代碼可知, Python 的迭代器一旦耗盡,便不再可以使用,即使繼續(xù)往容器中增加元素也不行。

由此可見(jiàn), Python 的迭代器中可能存在某種用于指示迭代器是否被耗盡的標(biāo)記,一旦迭代器被標(biāo)記為耗盡狀態(tài),便永遠(yuǎn)不可繼續(xù)使用了。

4.3.4 任何插入操作都將損壞Dict迭代器

考察如下代碼:

numDict={1:2}numDictIter=iter(numDict)numDict[3]=4#RuntimeErrornext(numDictIter)

當(dāng)對(duì)一個(gè) Dict 進(jìn)行插入操作后,原 Dict 迭代器將立即失效,并拋出 RuntimeError。這與 C++ 中的行為是一致的,且更為安全。

Set 與 Dict 具有相同的迭代器失效性質(zhì),不再重復(fù)討論。

5 后記

迭代器的故事到這里就結(jié)束了。總的看來(lái),Python 中的迭代器雖應(yīng)用廣泛,但并不是一種高級(jí)的,靈活的實(shí)現(xiàn),且存在著一些黑魔法。故唯有深入的去理解,才能真正的用好迭代器。祝編程愉快~

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 編程語(yǔ)言
    +關(guān)注

    關(guān)注

    10

    文章

    1945

    瀏覽量

    34757
  • python
    +關(guān)注

    關(guān)注

    56

    文章

    4797

    瀏覽量

    84727
  • 迭代器
    +關(guān)注

    關(guān)注

    0

    文章

    43

    瀏覽量

    4316

原文標(biāo)題:當(dāng)談?wù)摰鲿r(shí),我談些什么?

文章出處:【微信號(hào):rgznai100,微信公眾號(hào):rgznai100】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    談?wù)凱ython 中的迭代模式

    年,Design Patterns - Elements of Reusable Object-Oriented Software)中,它提出了23種設(shè)計(jì)模式。迭代模式就是其中的一種,在各種編程語(yǔ)言
    發(fā)表于 11-23 13:10 ?800次閱讀
    談?wù)凱ython 中的<b class='flag-5'>迭代</b><b class='flag-5'>器</b>模式

    Python高級(jí)特性:迭代切片的應(yīng)用

    在前兩篇關(guān)于 Python 切片的文章中,我們學(xué)習(xí)了切片的基礎(chǔ)用法、高級(jí)用法、使用誤區(qū),以及自定義對(duì)象如何實(shí)現(xiàn)切片用法(相關(guān)鏈接見(jiàn)文末)。本文是切片系列的第三篇,主要內(nèi)容是迭代切片。 迭代
    發(fā)表于 11-29 10:11 ?665次閱讀

    HFSS不能使用迭代求解

    新手小白提問(wèn),如圖,設(shè)置的是迭代求解,運(yùn)行時(shí)轉(zhuǎn)為直接求解導(dǎo)致內(nèi)存不夠,請(qǐng)大神解答為什么不能用迭代求解啊
    發(fā)表于 03-27 14:24

    多初值迭代過(guò)程如何圖示

    將函數(shù)的迭代過(guò)程圖示出來(lái),但是是多個(gè)初值,每個(gè)初值迭代的過(guò)程的數(shù)值結(jié)果都有,顯示在一張圖上。類似這種圖。求大神給個(gè)思路,用什么函數(shù)
    發(fā)表于 08-18 10:45

    請(qǐng)問(wèn)迭代的實(shí)現(xiàn)原理是什么?

    什么是集合框架?LIST接口的實(shí)際應(yīng)用?迭代的實(shí)現(xiàn)原理是什么?
    發(fā)表于 11-04 09:45

    js迭代異步介紹

    js 迭代 異步 介紹 (Introduction)It’s been a long while coming and I feel it’s high time I made a post
    發(fā)表于 09-06 09:26

    python迭代

    迭代對(duì)象,對(duì)于迭代對(duì)象,我們可以使用 next 函數(shù),去獲取元素,每執(zhí)行一次,獲取一次,等到全部獲取完畢,會(huì)拋出 StopIterati
    發(fā)表于 02-24 15:42

    OpenHarmony中的HDF單鏈表及其迭代

    成員的值設(shè)置成第1個(gè)節(jié)點(diǎn)的地址。因?yàn)閱捂湵碇恢С滞粋€(gè)方向查找,不支持往回查找,如上面的錯(cuò)誤范例。如果root記錄的是第二個(gè)節(jié)點(diǎn)地址,則第一個(gè)節(jié)點(diǎn)變得不可訪問(wèn)。迭代簡(jiǎn)介迭代是伴隨集
    發(fā)表于 08-30 10:31

    OpenHarmony中的HDF單鏈表及其迭代

    節(jié)點(diǎn)的地址。因?yàn)閱捂湵碇恢С滞粋€(gè)方向查找,不支持往回查找,如上面的錯(cuò)誤范例。如果root記錄的是第二個(gè)節(jié)點(diǎn)地址,則第一個(gè)節(jié)點(diǎn)變得不可訪問(wèn)。迭代簡(jiǎn)介迭代是伴隨集合概念產(chǎn)生的,意思是
    發(fā)表于 09-05 11:38

    Python學(xué)習(xí)點(diǎn):為什么 range() 不生成迭代

    迭代是 23 種設(shè)計(jì)模式中最常用的一種(之一),在 Python 中隨處可見(jiàn)它的身影,我們經(jīng)常用到它,但是卻不一定意識(shí)到它的存在。在關(guān)于迭代
    發(fā)表于 11-23 13:50 ?776次閱讀
    Python學(xué)習(xí)點(diǎn):為什么 range() 不生成<b class='flag-5'>迭代</b><b class='flag-5'>器</b>

    牛頓迭代如何迭代

    牛頓迭代法是原理是根據(jù)一個(gè)初始點(diǎn)在該點(diǎn)做切線,切線與X軸相交得出下一個(gè)迭代點(diǎn)的坐標(biāo),再在處做切線,依次類推,直到求得滿足精度的近似解為止。
    的頭像 發(fā)表于 03-09 10:52 ?2791次閱讀

    python迭代詳解

    python迭代 1. 可迭代對(duì)象 可以利用 for 循環(huán)的對(duì)象,都叫可迭代對(duì)象。 列表、元組、字典、字符串等都是可迭代對(duì)象。 # 以列表
    的頭像 發(fā)表于 02-24 15:42 ?1344次閱讀

    什么是迭代?

    對(duì)于int型數(shù)組除了用下標(biāo)訪問(wèn),還可以通過(guò)指針訪問(wèn),實(shí)際上迭代就是對(duì)指針進(jìn)行了封裝。
    的頭像 發(fā)表于 02-27 15:55 ?1889次閱讀
    什么是<b class='flag-5'>迭代</b><b class='flag-5'>器</b>?

    簡(jiǎn)單介紹C++中迭代

    之前的兩篇文章我們主要了解了vector和string的相關(guān)知識(shí),從中我們知道可以通過(guò)下標(biāo)來(lái)訪問(wèn)vector的元素或者string的字符,但是除了這種方式還有一種更為通用的方式獲取元素,那就是迭代
    的頭像 發(fā)表于 03-17 14:03 ?516次閱讀

    Python中的迭代介紹 迭代在scoreboard中的應(yīng)用有哪些?

    Iterator Design Pattern: 對(duì)容器 (聚合類,集合數(shù)據(jù)等) 的遍歷操作從容器中拆分出來(lái),放到迭代中,實(shí)現(xiàn)迭代操作的解耦。
    的頭像 發(fā)表于 08-08 09:41 ?620次閱讀
    Python中的<b class='flag-5'>迭代</b><b class='flag-5'>器</b>介紹 <b class='flag-5'>迭代</b><b class='flag-5'>器</b>在scoreboard中的應(yīng)用有哪些?