C++20 給我們帶來了非?,F(xiàn)代化的協(xié)程特性,但是主要的增加都集中于語核部分。由于庫特性尚未準(zhǔn)備充分,所以 C++20 標(biāo)準(zhǔn)庫中尚沒有多少現(xiàn)成的、組裝好的協(xié)程設(shè)施供我們使用。但是!僅僅通過使用std::coroutine_handle(這是一個編譯器為之開洞的類)并在你的類中定制好幾個規(guī)定的接口,我們就可以組合出五花八門的功能。你可以理解為,雖然我們沒有現(xiàn)成的飛機、火車,但是我們有沙子和鐵礦石!完全可以從沙子和鐵礦石出發(fā),造出飛機、火車。我知道很多人詬病 C++ 的這個特點,沒有現(xiàn)成的這個、現(xiàn)成的那個,自己造很麻煩。但是這也是我比較喜歡 C++ 的一點——上限非常高,你可以為自己的飛機、火車做定制,加上你想要的功能或去掉你不想要的功能;除此以外,你甚至還可以造出之前還沒有問世的東西,比如星艦!在其他語言中,語言和標(biāo)準(zhǔn)庫給你提供了什么就是什么了,你幾乎沒有超越的能力。
在 C++23 周期,LEWG (庫特性工作組) 在新冠肆虐的艱難背景下完成了大量的工作,使得 C++23 增添了不少很有益的設(shè)施(可參考 C++23特性總結(jié) - 上 - Mick235711的文章 - 知乎 https://zhuanlan.zhihu.com/p/562383157)。但是,對于協(xié)程方面的內(nèi)容還是舉棋不定。std::generator和std::lazy在合并的計劃里進(jìn)進(jìn)出出,而最終只有std::generator達(dá)成目標(biāo)。對于更花花綠綠的協(xié)程庫,像task等,則可憐的連提案都沒有。
另外,在可預(yù)見的將來,哪怕標(biāo)準(zhǔn)庫收錄了一些基本的協(xié)程類,為了探索更加花花綠綠的協(xié)程高級功能,我們還是需要從最基本的協(xié)程設(shè)施出發(fā),也就是理解std::coroutine_handle和相應(yīng)的接口。
本文將向讀者展示如何實現(xiàn)一個簡單的生成器 (generator) 和一個能支持協(xié)程內(nèi)外雙向信息傳遞的生成器。網(wǎng)上關(guān)于什么是協(xié)程的講解很多,哪怕是講 C++ 協(xié)程的中文材料也不少。且因筆者時間精力有限,本文不會詳細(xì)地介紹協(xié)程概念,而是更側(cè)重于展示怎么實現(xiàn)出一個 generator,以填補相關(guān)參考資料的不足。
1
感性的了解一下協(xié)程
協(xié)程可以簡單地理解為:一個執(zhí)行時可以主動打斷,程序執(zhí)行流程可以在調(diào)用方和被調(diào)用方之間進(jìn)進(jìn)出出若干次的函數(shù)。
Python 是最早的一批支持協(xié)程的語言,我們不妨用 Python 來演示一下協(xié)程的神奇。(其實早在 19 年,那時 C++ 編譯器還沒支持協(xié)程的時候,筆者就是利用 Python 來理解協(xié)程的)
從這個例子我們可以看出以下幾點怪異的現(xiàn)象:
1)myrange函數(shù)中并沒有一句return語句,我們卻調(diào)用myrange函數(shù)得到了一個gen對象(第 22 行)
2) 22 行調(diào)用myrange函數(shù)后,這個函數(shù)似乎并沒有立即開始執(zhí)行(沒有執(zhí)行第 3 行的print語句,倒是執(zhí)行第 23 行的print語句了)
3) 調(diào)用gen對象的__next__方法后,myrange函數(shù)開始執(zhí)行。執(zhí)行到第 7 行時,myrange函數(shù) "yield" 了一個值,然后程序的執(zhí)行流程又切換到主函數(shù)的第 24 行。__next__方法得到了剛剛 "yield" 的結(jié)果。
4) 26 行再次調(diào)用__next__時,執(zhí)行流程回到了myrange中。而且并不是從myrange的開頭重新開始執(zhí)行,而是從上一次 "yield" 的地方,也就是第 7 行繼續(xù)執(zhí)行。i 的值似乎也沒受到影響。
如果你熟悉了協(xié)程的特點,這無非可以概括為,協(xié)程執(zhí)行時可以主動打斷(更學(xué)術(shù)一點叫掛起)自己,將控制權(quán)交還給調(diào)用方。協(xié)程掛起期間,協(xié)程的棧上信息都可以得到保留。協(xié)程恢復(fù)后,從上一次的掛起點繼續(xù)執(zhí)行。
經(jīng)過封裝后的 C++ 協(xié)程庫,也可以向用戶展示出和 Python 中幾乎完全一致的用法。如下就是我們將要實現(xiàn)的generator所展示的應(yīng)用效果。
當(dāng)然,C++ 畢竟是一個靜態(tài)類型的語言,除了range函數(shù)要寫 “返回值”generator
2
std::coroutine_handle
std::coroutine_handle類模板是為我們實現(xiàn)協(xié)程的各種“魔法”提供支持的最底層的設(shè)施,其主要負(fù)責(zé)存儲協(xié)程的句柄。它分為模板std::coroutine_handle
打開
std::coroutine_handle中保存了協(xié)程的上下文。我們協(xié)程執(zhí)行到哪兒切出去了(協(xié)程切換回來后從哪兒開始繼續(xù)執(zhí)行)?我們協(xié)程的棧上變量在協(xié)程切出去期間怎么能得到保留?這些問題的解決都是歸功于std::coroutine_handle保存了協(xié)程的上下文。
std::coroutine_handle中的方法不多,但是各個都至關(guān)重要。由于有些概念還沒有鋪墊,我們先只羅列三個比較容易理解的方法:
done方法,可以查詢一個協(xié)程是否已經(jīng)結(jié)束;
resume方法可以恢復(fù)一個協(xié)程的執(zhí)行;
destroy方法可以銷毀一個協(xié)程。
std::coroutine_handle只是一個很底層很底層的設(shè)施,沒有 RAII 包裹。它就像裸指針一樣(其實它內(nèi)部也就是一個裸指針),需要靠我們手動創(chuàng)建、手動銷毀。我們剛剛談到,std::coroutine_handle保存了協(xié)程的上下文,其中就有棧上變量的信息。如果一個 handle 被創(chuàng)建出來,用完以后我們忘了對它調(diào)用 destroy 了,那么其中存儲的上下文信息當(dāng)然也就沒有被銷毀——也就是內(nèi)存泄漏了。如果不小心做了兩次 destroy,那么就可能會引發(fā) double free 錯誤了。所以,我們得寫一個 RAII 類將其包裝起來,以解決忘記銷毀或者其他比如淺拷貝等問題。
這里,鄭重向大家推薦由清華大學(xué)出版社出版的《C++20 實踐入門》和《C++20 高級編程》。這兩本書是目前最新的一批介紹 C++20 的教程。該書緊跟潮流,就 C++20 的幾大熱點內(nèi)容,如modules、concepts、ranges等作了詳細(xì)介紹。全卷內(nèi)容質(zhì)量上乘,精雕細(xì)琢,非那些在歷史舊版本的基礎(chǔ)上草草加兩章節(jié)新內(nèi)容圈錢的書可比也!
非常感謝清華大學(xué)出版社對這篇文章的贊助!本著對我的讀者負(fù)責(zé)的態(tài)度,我堅持要求審讀完書的大部分內(nèi)容后才能做推薦,清華大學(xué)出版社的編輯對此給予了高度支持。且,從 8 月份聯(lián)系我開始,到本文落筆,編輯非常寬容地給了我 4 個月的時間 —— 一段非常充足的時間閱讀了這兩本書,之后才有了這里的精心推薦。再次表示致敬和謝意!
3
generator
我們的generator類終于出場了。
首先,C++ 的協(xié)程要求generator中必須有promise_type這個類型。你可以通過typedef/using的方式 alias 一個別名,也可以干脆就定義成generator的內(nèi)部類 —— 本文選擇后者。
templatestruct generator { struct promise_type { } };
promise_type中有這么幾個可定制的、會影響協(xié)程行為的重要接口,先介紹兩個:
1)initial_suspend—— 它回答的是協(xié)程一出生時是否就要馬上掛起的問題;
2)final_suspend—— 它回答的是協(xié)程最后一次是否要掛起的問題;
對于一個generator而言,這兩個問題的回答是:
初始時始終都要掛起,最后一次始終都不掛起。
std::suspend_alwaysstd::suspend_never是標(biāo)準(zhǔn)庫里面已經(jīng)定義好的類型,可以方便地回答是否要掛起的問題。
struct promise_type { ... std::suspend_always initial_suspend() const { return {}; } std::suspend_never final_suspend() const noexcept // 這里注意一下,由于 final_suspend 在收尾階段工作,所以必須是 noexcept 的 { return {}; } }
在新協(xié)程創(chuàng)建完畢好后,C++ 會執(zhí)行co_await promise.initial_suspend(),同樣的, 在協(xié)程結(jié)束前也會co_await promise.final_suspend()。當(dāng)然了,從名字中我們也能看出,co_await一個std::suspend_always時,執(zhí)行流程永遠(yuǎn)都會無條件切出去,而對于std::suspend_never則是永遠(yuǎn)也不會切出。
還記得我們剛剛觀察的 Python 代碼中的現(xiàn)象嗎?主函數(shù)中調(diào)用myrange的時候,是不是立馬得到一個gen對象的?是不是myrange里面沒有立即得到執(zhí)行的?在第一次調(diào)用__next__的時候才會去執(zhí)行的吧?這其實就是因為myrange協(xié)程一創(chuàng)建好就掛起自己將程序流程切回到調(diào)用方了。
如果initial_suspend這里回答的是suspend_never,那么協(xié)程就會立刻開始執(zhí)行。
建議等generator實現(xiàn)完成后讀者自己動手實踐下,將initial_suspend和final_suspend的回答換換,看看結(jié)果會有什么改變。
3)promise_type中第三個定制接口是unhandled_exception,它回答的是協(xié)程被其里頭的沒有捕獲的異常終止時做何處理的問題。
我們這里只是簡單處理一下,調(diào)用exit提前終止程序。當(dāng)然這樣的做法太簡化了,實際應(yīng)用時可以考慮使用std::exception_ptr等設(shè)施做更嚴(yán)謹(jǐn)?shù)奶幚怼?/p>
struct promise_type { ... void unhandled_exception() { std::exit(EXIT_FAILURE); } }
4)promise_type中第四個定制接口,也是最核心的一個是get_return_object。這個方法也涉及到了如何創(chuàng)建一個 coroutine 的問題 —— 答案就是使用std::coroutine_handle
現(xiàn)在,通過get_return_object得到了return_object,就會開始詢問是否要做initial_suspend了 (剛剛介紹的initial_suspend還記得嗎?)
templatestruct generator { struct promise_type; std::coroutine_handle handle; struct promise_type { ... generator get_return_object() { return generator{std::coroutine_handle ::from_promise(*this)}; } }; generator(std::coroutine_handle handle) : handle(handle) { } ... };
我們之前也提到,coroutine_handle是無 RAII 的,因此generator中得根據(jù)三/五法則,做好 RAII。該析構(gòu)的析構(gòu),禁止拷貝,寫好移動構(gòu)造/移動賦值。
templatestruct generator { struct promise_type; std::coroutine_handle handle; ... public: generator() = default; generator(const generator &) = delete; private: generator(std::coroutine_handle handle) : handle(handle) { } public: generator(generator && src) : handle(src.handle) { src.handle = nullptr; } generator& operator=(const generator &) = delete; generator& operator=(generator && src) { if (!handle) { handle.destroy(); } handle = src.handle; src.handle = nullptr; } ~generator() { if (!handle) { handle.destroy(); } } ... };
5) 定制yield_value接口
接下來的定制則對于generator來說至關(guān)重要,我們馬上就可以讓我們的generator支持 yield 了!
還是以此舉例,co_yield關(guān)鍵字實際上只是一個語法糖,這一行會被編譯器替換為co_await promise.yield_value(i),在有了initial_suspend和final_suspend的經(jīng)驗后,我們這次也就能很容易地猜測出,我們要在promise_type中實現(xiàn)一個yield_value方法,而返回值負(fù)責(zé)回答要不要切出的問題。顯然,每次 yield 時總是要掛起協(xié)程,所以,yield_value方法的返回值類型應(yīng)當(dāng)是suspend_always。你猜對了嗎?
struct promise_type { .... std::optionalopt; template std::suspend_always yield_value(Arg && arg) { opt.emplace(std::forward (arg)); return {}; } };
在promise中,我們還增加了一個optional,用以存放 yield 的結(jié)果。注意,很多例子,甚至包括 cppreference 在內(nèi),promise內(nèi)部都是用的T類型的裸值來存放 yield 的結(jié)果的。在模板編程中這樣做兼容性不太好,我們需要考慮能照顧到不可默認(rèn)構(gòu)造的類型。除此以外,我們使用萬能引用和完美轉(zhuǎn)發(fā)以提升構(gòu)造值時的性能。
而這個opt,當(dāng)然是在等generator來取它的。
templatestruct generator { ... T & next() { handle.resume(); if (handle.done()) { throw generator_done("generator done"); } return *(handle.promise().opt); } }; generator range(int n) { for(int i = 0; i < n; ++i) { co_yield i; } } int main() { generator gen = range(4); for (int i = 0; i < 4; ++i) { std::cout << gen.next() << std::endl; } }
這里需要結(jié)合前文介紹過的內(nèi)容梳理下。由于initial_suspend的返回值是suspend_always,所以協(xié)程剛創(chuàng)建好后就切出,執(zhí)行流程到了gen = range(4)。
再下面,每次對gen調(diào)用next方法時,會執(zhí)行handle.resume()恢復(fù)協(xié)程。
協(xié)程首次恢復(fù)運行,當(dāng)然是從range函數(shù)的開頭開始執(zhí)行 (如果不是首次恢復(fù)運行,當(dāng)然就是從上一次 yield 出去的地方恢復(fù)運行),直到碰上了co_yield。這時, 調(diào)用promise.yield_value(i),根據(jù)co_yield后面值 (也就是i) 構(gòu)造好了值保存在opt中。隨后,由于promise.yield_value(i)的結(jié)果是suspend_always,所以協(xié)程切出, 執(zhí)行流程回到了handle.resume()之后。正常情況下 (協(xié)程沒有執(zhí)行完畢),next方法就會從promise里的那個optional中取出 yield 的結(jié)果,返回給主函數(shù)中以供輸出。如果檢測到已經(jīng)是最后一次 yield 后再調(diào)用next的 (即 resume 后檢測到 done 的話),則拋出generator_done異常。
完整的generator代碼如下:
#include#include #include #include #include struct generator_done : std::logic_error { private: typedef std::logic_error super; public: using super::super; }; template struct generator { struct promise_type; std::coroutine_handle handle; struct promise_type { std::optional opt; std::suspend_always initial_suspend() const { return {}; } std::suspend_never final_suspend() const noexcept { return {}; } void unhandled_exception() { std::exit(EXIT_FAILURE); } generator get_return_object() { return generator{std::coroutine_handle ::from_promise(*this)}; } template std::suspend_always yield_value(Arg && arg) { opt.emplace(std::forward (arg)); return {}; } }; public: generator() = default; generator(const generator &) = delete; private: generator(std::coroutine_handle handle) : handle(handle) { } public: generator(generator && src) : handle(src.handle) { src.handle = nullptr; } generator& operator=(const generator &) = delete; generator& operator=(generator && src) { if (!handle) { handle.destroy(); } handle = src.handle; src.handle = nullptr; } ~generator() { if (!handle) { handle.destroy(); } } T & next() { handle.resume(); if (handle.done()) { throw generator_done("generator done"); } return *(handle.promise().opt); } }; generator range(int n) { for(int i = 0; i < n; ++i) { co_yield i; } } int main () { generator gen = range(5); for (int i = 0; i < 5; ++i) { std::cout << gen.next() << std::endl; }
}
4
能雙向傳遞信息的
bigenerator
我們目前完成的generator只能做到協(xié)程內(nèi)部向外部 yield 一個值,傳遞出來信息。能不能做到外部也向協(xié)程內(nèi)部回復(fù)一個值,將信息由外部傳遞到協(xié)程內(nèi)部呢?C++ 的協(xié)程機制也是允許的。
其實,co_yield表達(dá)式,當(dāng)然,我們上面也知道了, 其實就是co_await promise.yield_value()這個表達(dá)式,其實也是有計算結(jié)果的,只不過,我們之前generator中的例子,計算結(jié)果為void類型 —— 沒有返回值罷了。
要想整個表達(dá)式有返回值,當(dāng)然我們得從promise.yield_value()的返回值入手。我們以前用的是std::suspend_always,現(xiàn)在得自己配置了。
先上效果:
再上源碼:
#include#include #include #include #include struct generator_done : std::logic_error { private: typedef std::logic_error super; public: using super::super; }; template struct bigenerator { struct promise_type; std::coroutine_handle handle; struct awaitable : public std::suspend_always { std::variant * ref; U & await_resume() const { return std::get(*ref); } }; struct promise_type { std::variant var; std::suspend_always initial_suspend() const { return {}; } std::suspend_never final_suspend() const noexcept { return {}; } void unhandled_exception() { std::exit(EXIT_FAILURE); } bigenerator get_return_object() { return bigenerator{std::coroutine_handle ::from_promise(*this)}; } template awaitable yield_value(Arg && arg) { var.template emplace (std::forward (arg)); return awaitable{.ref = &var}; } }; public: bigenerator() = default; bigenerator(const bigenerator &) = delete; private: bigenerator(std::coroutine_handle handle) : handle(handle) { } public: bigenerator(bigenerator && src) : handle(src.handle) { src.handle = nullptr; } bigenerator& operator=(const bigenerator &) = delete; bigenerator& operator=(bigenerator && src) { if (!handle) { handle.destroy(); } handle = src.handle; src.handle = nullptr; } ~bigenerator() { if (!handle) { handle.destroy(); } } template T & next(Args&& ... args) { handle.promise().var.template emplace(std::forward (args)...); handle.resume(); if (handle.done()) { throw generator_done("generator done"); } return std::get (handle.promise().var); } }; bigenerator range(int n) { for(int i = 0; i < n; ++i) { std::string sunk = co_yield i; std::cout << sunk << std::endl; } } int main () { bigenerator gen = range(10); for (int i = 0; i < 5; ++i) { std::cout << gen.next(i + 1, 'a') << std::endl; } }
然后講解:
主要變動就是一個新的內(nèi)部類:awaitable,在bigenerator中,yield_value接口返回的就是這個類型。它繼承自std::suspend_always,表明我們確實還是需要每次 yield 時都要掛起,但是,這里我們重寫了await_resume方法,使得協(xié)程在恢復(fù)時調(diào)用這個方法,從 promise 中取出外界傳遞進(jìn)去的結(jié)果。
struct awaitable : public std::suspend_always { std::variant* ref; U & await_resume() const { return std::get(*ref); } };
下面的代碼片段展示了yield_value中怎么構(gòu)造awaitable。其實只要告知 promise 中的variant的地址就可以了。bigenerator中改用了variant,主要是考慮到 yield 出去的值和 resume 時傳遞進(jìn)來的值不會在同一時刻存在,使用variant有助于節(jié)省空間。
struct promise_type { ... std::variantvar; template awaitable yield_value(Arg && arg) { var.template emplace (std::forward (arg)); return awaitable{.ref = &var}; } };
還有bigenerator中next的變化,其實也就是恢復(fù)協(xié)程前,在 promise 的variant中構(gòu)造好傳進(jìn)去的對象就好了。
templatestruct bigenerator { ... template T & next(Args&& ... args) { handle.promise().var.template emplace(std::forward (args)...); handle.resume(); if (handle.done()) { throw generator_done("generator done"); } return std::get (handle.promise().var); } };
當(dāng)然,我們這里沒有考慮到bigenerator
全文完。
審核編輯 :李倩
-
C++
+關(guān)注
關(guān)注
22文章
2113瀏覽量
73745 -
編譯器
+關(guān)注
關(guān)注
1文章
1640瀏覽量
49198 -
生成器
+關(guān)注
關(guān)注
7文章
317瀏覽量
21062
原文標(biāo)題:C++ coroutine generator 實現(xiàn)筆記
文章出處:【微信號:程序喵大人,微信公眾號:程序喵大人】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論