0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Serverless冷啟動(dòng):如何讓函數(shù)計(jì)算更快更強(qiáng)?

jf_21561199 ? 來源:jf_21561199 ? 作者:jf_21561199 ? 2023-09-03 09:33 ? 次閱讀

問題背景

Serverless 計(jì)算也稱服務(wù)器無感知計(jì)算或函數(shù)計(jì)算,是近年來一種新興的云計(jì)算編程模式。其致力于大幅簡(jiǎn)化云業(yè)務(wù)開發(fā)流程,使得應(yīng)用開發(fā)者從繁雜的服務(wù)器運(yùn)維工作中解放出來(例如自動(dòng)伸縮、日志和監(jiān)控等)。借助 Serverless 計(jì)算,開發(fā)者僅需上傳業(yè)務(wù)代碼并進(jìn)行簡(jiǎn)單的資源配置便可實(shí)現(xiàn)服務(wù)的快速構(gòu)建部署,云服務(wù)商則按照函數(shù)服務(wù)調(diào)用量和實(shí)際資源使用收費(fèi),從而幫助用戶實(shí)現(xiàn)業(yè)務(wù)的快速交付(fastbuilt&Relia.Deliv.)和低成本運(yùn)行。

然而,Serverless 計(jì)算的無狀態(tài)函數(shù)編程在帶來高度彈性和靈活性的同時(shí),也導(dǎo)致了不可避免的冷啟動(dòng)問題。由于函數(shù)通常在執(zhí)行完請(qǐng)求后被釋放,當(dāng)請(qǐng)求到達(dá)時(shí),如果沒有可用實(shí)例則需要從零開始啟動(dòng)新的實(shí)例處理請(qǐng)求(即冷啟動(dòng))。當(dāng)冷啟動(dòng)發(fā)生時(shí),Serverless 平臺(tái)需要執(zhí)行實(shí)例調(diào)度、鏡像分發(fā)、實(shí)例創(chuàng)建、資源配置、運(yùn)行環(huán)境初始化以及代碼加載等一系列操作,這一過程引發(fā)的時(shí)延通??蛇_(dá)請(qǐng)求實(shí)際執(zhí)行時(shí)間的數(shù)倍。相對(duì)于冷啟動(dòng)調(diào)用,熱調(diào)用(即請(qǐng)求到達(dá)時(shí)有可用實(shí)例)的準(zhǔn)備時(shí)間可以控制在亞毫秒級(jí)。在特定領(lǐng)域例如 AI 推理場(chǎng)景,冷啟動(dòng)調(diào)用導(dǎo)致的高時(shí)延問題則更為突出,例如,使用 TensorFlow 框架的啟動(dòng)以及讀取和加載模型可能需要消耗數(shù)秒或數(shù)十秒。

wKgaomTyHL2AbQwFAANxG8UqQdQ148.png

因此,如何緩解 Serverless 函數(shù)的冷啟動(dòng)問題,改善函數(shù)性能是當(dāng)前 Serverless 領(lǐng)域面臨的主要挑戰(zhàn)之一。

解決方案

從研究思路上看,目前工業(yè)界和學(xué)術(shù)界主要從兩個(gè)方面入手解決冷啟動(dòng)問題:

(1)加快實(shí)例啟動(dòng)速度:當(dāng)冷啟動(dòng)調(diào)用發(fā)生時(shí),通過加速實(shí)例的初始化過程來減少啟動(dòng)時(shí)延;

當(dāng)冷啟動(dòng)發(fā)生時(shí),Serverless 平臺(tái)內(nèi)部實(shí)例的初始化過程可以劃分為準(zhǔn)備和加載兩個(gè)階段。其中,準(zhǔn)備階段主要包括控制面決策調(diào)度/鏡像獲取、Runtime 運(yùn)行時(shí)初始化、應(yīng)用數(shù)據(jù)/代碼傳輸幾個(gè)部分。而加載階段位于實(shí)例內(nèi)部,包括用戶應(yīng)用框架和代碼的初始化過程。在工業(yè)界和學(xué)術(shù)界公開的研究成果中,針對(duì)實(shí)例啟動(dòng)過程中的每個(gè)階段都有大量的技術(shù)手段和優(yōu)化方法。如下圖所示,經(jīng)過優(yōu)化,實(shí)例冷啟動(dòng)的準(zhǔn)備階段和加載階段時(shí)間可被極大得縮短。

wKgZomTyHL2AKV_JAAINSvP5RBw403.png

下面列舉了一些近年來發(fā)表在計(jì)算機(jī)系統(tǒng)領(lǐng)域知名會(huì)議的相關(guān)工作,主要可以分為五個(gè)方面:

1、調(diào)度優(yōu)化/鏡像快速分發(fā)/本地池化:

例如基于樹結(jié)構(gòu)的跨節(jié)點(diǎn)快速鏡像分發(fā)FaasNet[ATC'21];Pod 池+特化實(shí)例跳過鏡像傳輸[華為 FunctionGraph]。其中,快速鏡像分發(fā)依賴于 VM 節(jié)點(diǎn)的上/下行網(wǎng)絡(luò)帶寬,Pod 池特化技術(shù)則是典型的以空間換時(shí)間的做法。

2、輕量級(jí)虛擬化/安全容器:

例如針對(duì)傳統(tǒng)容器 Docker 的精簡(jiǎn)優(yōu)化工作 SOCK[ATC'21];更側(cè)重安全性的輕量級(jí)虛擬化技術(shù)(KataContainers,gVisor 等);基于安全容器的進(jìn)一步的精簡(jiǎn)優(yōu)化工作(Catalyzer[ASPLOS'20],REAP[ASPLOS'21])。通過裁剪優(yōu)化,安全容器的啟動(dòng)時(shí)延最快可以被壓縮至亞毫秒級(jí)。

3、數(shù)據(jù)共享/跨節(jié)點(diǎn)傳輸優(yōu)化:

例如基于 RDMA 共享內(nèi)存減少跨節(jié)點(diǎn)啟動(dòng)過程的數(shù)據(jù)拷貝RemoteFork[OSDI'23];或者利用本地代碼緩存跳過代碼傳輸[華為 FunctionGraph,字節(jié) ByteFaaS 等]?;?RDMA 技術(shù)的跨節(jié)點(diǎn)數(shù)據(jù)傳輸時(shí)延可降低至微妙級(jí)。

4、用戶代碼精簡(jiǎn)/快速加載:

例如針對(duì) Java 語言的 JVM(JavaVirtualMachine)運(yùn)行時(shí)優(yōu)化技術(shù)[FunctionGraph];以及針對(duì) Python 運(yùn)行時(shí)庫(kù)的裁剪優(yōu)化工作 FaasLight[arxiv'23]。通過特定的優(yōu)化,JVM 啟動(dòng)時(shí)間可由數(shù)秒降低至數(shù)十毫秒,而 Python 代碼的啟動(dòng)加載時(shí)延可降低約 1/3。

5、其它非容器運(yùn)行時(shí)技術(shù):

例如 WASM(即 WebAssembly)技術(shù)以及針對(duì) WASM 的內(nèi)存隔離方面的優(yōu)化工作 Faasm[ATC'20]。相比容器化技術(shù),直接以進(jìn)程和線程方式組織運(yùn)行函數(shù),可在保證低開銷函數(shù)運(yùn)行的同時(shí)具備高度靈活性。

(2)降低冷啟動(dòng)發(fā)生率:通過函數(shù)預(yù)熱、復(fù)用或?qū)嵗蚕淼确椒ㄌ岣邔?shí)例的利用效率,減少冷啟動(dòng)調(diào)用的發(fā)生

盡管已有的一些實(shí)例啟動(dòng)加速方法已經(jīng)可以將運(yùn)行時(shí)環(huán)境的初始化時(shí)間壓縮至數(shù)十毫秒甚至是數(shù)毫秒,然而用戶側(cè)的延遲卻仍然存在,例如程序狀態(tài)的恢復(fù),變量或者配置文件的重新初始化,相關(guān)庫(kù)和框架的啟動(dòng)。具體來講,在機(jī)器學(xué)習(xí)應(yīng)用中,TensorFlow 框架的啟動(dòng)過程往往需要花費(fèi)數(shù)秒,即使實(shí)例運(yùn)行時(shí)環(huán)境的啟動(dòng)時(shí)間再短,應(yīng)用整體的冷啟動(dòng)時(shí)延對(duì)用戶而言依然是無法接受的(注:通常大于 200ms 的時(shí)延可被用戶察覺)。在這種情況下,可以從另一個(gè)角度入手解決冷啟動(dòng)問題,即降低冷啟動(dòng)調(diào)用的發(fā)生率。例如,通過緩存完整的函數(shù)實(shí)例,請(qǐng)求到達(dá)時(shí)可以快速恢復(fù)并處理請(qǐng)求,從而實(shí)現(xiàn)近乎零的初始化時(shí)延(例如 Dockerunpause 操作時(shí)延小于 0.5ms)。

wKgaomTyHL2AWXD2AADvv_2GAtM689.png

降低冷啟動(dòng)發(fā)生率的相關(guān)研究可以分為如下幾個(gè)方面:

1、實(shí)例?;?實(shí)例預(yù)留:

例如基于 Time-to-Live 的 keepalive 保活機(jī)制[AWSLambda,OpenWhisk];或者通過并發(fā)配置接口預(yù)留一定數(shù)量的實(shí)例[AWSLabmda 等];這些方法原理簡(jiǎn)單,易于實(shí)現(xiàn),但是在面對(duì)負(fù)載變化時(shí)緩存效率較低。

2、基于負(fù)載特征學(xué)習(xí)的動(dòng)態(tài)緩存:

例如基于請(qǐng)求到達(dá)間隔預(yù)測(cè)的動(dòng)態(tài)緩存方案ServerlessintheWild[ASPLOS'20];學(xué)習(xí)長(zhǎng)短期負(fù)載變化特征的動(dòng)態(tài)緩存方案INFless[ASPLOS'22];基于優(yōu)先級(jí)的可替換緩存策略 FaasCache[ATC'21];面向異構(gòu)服務(wù)器集群的低成本緩存方案IceBreaker[ASPLOS'22]。這些動(dòng)態(tài)緩存方案根據(jù)負(fù)載特征學(xué)習(xí)決定實(shí)例緩存數(shù)量或時(shí)長(zhǎng),從而在降低冷啟動(dòng)調(diào)用率的同時(shí)改善緩存資源消耗。

3、優(yōu)化請(qǐng)求分發(fā)提高命中率:

例如兼顧節(jié)點(diǎn)負(fù)載和本地化執(zhí)行的請(qǐng)求調(diào)度算法CH-RLU[HPDC'22]。通過權(quán)衡節(jié)點(diǎn)負(fù)載壓力和緩存實(shí)例的命中率來對(duì)請(qǐng)求的分發(fā)規(guī)則進(jìn)行優(yōu)化設(shè)計(jì),避免節(jié)點(diǎn)負(fù)載過高導(dǎo)致性能下降,同時(shí)兼顧冷啟動(dòng)率。

4、改善并發(fā)/實(shí)例共享或復(fù)用:

例如允許同一函數(shù)工作流的多個(gè)函數(shù)共享 Sandbox 環(huán)境SAND[ATC'18];使用進(jìn)程或線程編排多個(gè)函數(shù)到單個(gè)實(shí)例中運(yùn)行Faastlane[ATC'21];提高實(shí)例并發(fā)處理能力減少實(shí)例創(chuàng)建Fifer[Middle'20];允許租戶復(fù)用其它函數(shù)的空閑實(shí)例減少冷啟動(dòng)時(shí)間Pagurus[ATC'22]。這些實(shí)例共享或者復(fù)用技術(shù)可以同緩存方案結(jié)合使用,降低冷啟動(dòng)帶來的性能影響。

總結(jié)

Serverless 的無狀態(tài)設(shè)計(jì)賦予了函數(shù)計(jì)算高度彈性化的擴(kuò)展能力,然而也帶來了難以避免的冷啟動(dòng)問題。消除 Serverless 函數(shù)的冷啟動(dòng)開銷還是從降低函數(shù)冷啟動(dòng)率和加速實(shí)例啟動(dòng)過程兩個(gè)角度綜合入手。對(duì)于冷啟動(dòng)開銷比較大的函數(shù),在函數(shù)計(jì)算框架的設(shè)計(jì)機(jī)制中進(jìn)行優(yōu)化,盡量避免冷啟動(dòng)發(fā)生;當(dāng)冷啟動(dòng)發(fā)生時(shí),采用一系列啟動(dòng)加速技術(shù)來縮短整個(gè)過程進(jìn)行補(bǔ)救。在 Serverless 平臺(tái)的內(nèi)部,冷啟動(dòng)的管理在實(shí)踐中可以做進(jìn)一步精細(xì)的劃分,例如針對(duì) VIP 大客戶,針對(duì)有規(guī)律負(fù)載的,或是針對(duì)冷啟動(dòng)開銷小的函數(shù),通過分類做定制化、有目的的管理可以進(jìn)一步改善系統(tǒng)效率。

編輯:黃飛

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 云計(jì)算
    +關(guān)注

    關(guān)注

    39

    文章

    7800

    瀏覽量

    137401
  • 服務(wù)器
    +關(guān)注

    關(guān)注

    12

    文章

    9160

    瀏覽量

    85420
  • 函數(shù)
    +關(guān)注

    關(guān)注

    3

    文章

    4331

    瀏覽量

    62618
  • serverless
    +關(guān)注

    關(guān)注

    0

    文章

    65

    瀏覽量

    4512
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    單片機(jī)復(fù)位和冷啟動(dòng)詳細(xì)介紹

    單片機(jī)冷啟動(dòng)很簡(jiǎn)單,關(guān)電,再上電,正常復(fù)位后,就冷啟動(dòng)成功。單片機(jī)冷啟動(dòng)其實(shí)是一個(gè)技術(shù)術(shù)語,是指單片機(jī)從最原始狀態(tài)啟動(dòng)運(yùn)行。實(shí)現(xiàn)這一目標(biāo)視不同的單片機(jī)內(nèi)部結(jié)構(gòu)而有所不同。
    的頭像 發(fā)表于 02-12 13:38 ?2w次閱讀
    單片機(jī)復(fù)位和<b class='flag-5'>冷啟動(dòng)</b>詳細(xì)介紹

    基于阿里云Serverless架構(gòu)下函數(shù)計(jì)算的最新應(yīng)用場(chǎng)景詳解(一)

    結(jié)合阿里云的函數(shù)計(jì)算產(chǎn)品來講解各個(gè)應(yīng)用場(chǎng)景中架構(gòu)以及如何解決的場(chǎng)景中的痛點(diǎn)。阿里云的函數(shù)計(jì)算是基于Serverless這種架構(gòu)實(shí)現(xiàn)的一個(gè)全托
    發(fā)表于 01-25 11:06

    Bazaar:阿里云Serverless計(jì)算服務(wù)探秘

    完成。從而將業(yè)務(wù)開發(fā)人員解放出來,他們更好的關(guān)注自身業(yè)務(wù)。這便是 Serverless 計(jì)算背后的核心思想??梢娺@一思想能夠產(chǎn)生的一大基石便是云計(jì)算服務(wù)。只有憑借云
    發(fā)表于 06-08 15:35

    Serverless概念

    Serverless簡(jiǎn)介概念Serverless的全稱是Serverless computing無服務(wù)器運(yùn)算,又被稱為函數(shù)即服務(wù)(Function-as-a-Service,縮寫為 F
    發(fā)表于 09-15 07:38

    北斗/GPS定位模塊冷啟動(dòng)、熱啟動(dòng)、溫啟動(dòng)有什么區(qū)別?

    的衛(wèi)星的位置、歷書和UTC時(shí)間,但保存的內(nèi)容不是當(dāng)前可視衛(wèi)星的數(shù)據(jù)。GPS重啟以后嘗試去獲得當(dāng)前衛(wèi)星和信號(hào)并計(jì)算其新位置。    一張表徹底搞懂什么是冷啟動(dòng)、熱啟動(dòng)、溫啟動(dòng)
    發(fā)表于 09-14 14:37

    冷啟動(dòng)電子鎮(zhèn)流器電路圖

    冷啟動(dòng)電子鎮(zhèn)流器電路圖
    發(fā)表于 06-11 11:06 ?1472次閱讀
    <b class='flag-5'>冷啟動(dòng)</b>電子鎮(zhèn)流器電路圖

    全球公測(cè),阿里云Serverless Kubernetes 更快更強(qiáng)、更省心

    服務(wù)訪問。Serverless Kubernetes適用于哪些場(chǎng)景?Serverless Kubernetes結(jié)合容器的高移植性和高靈活性與阿里云彈性計(jì)算提供的彈性調(diào)度和隔離性,其應(yīng)用場(chǎng)景非常廣泛,可
    發(fā)表于 08-17 17:45 ?407次閱讀

    函數(shù)計(jì)算性能福利篇(一) —— 系統(tǒng)冷啟動(dòng)優(yōu)化

    調(diào)用或者負(fù)載升高需要更多的實(shí)例來處理對(duì)應(yīng)的請(qǐng)求。"冷啟動(dòng)"對(duì)于毛刺敏感的業(yè)務(wù)會(huì)顯得不那么友好,所以冷啟動(dòng)的優(yōu)化對(duì)于函數(shù)計(jì)算在延時(shí)敏感型場(chǎng)景中的應(yīng)用尤為重要。系統(tǒng)架構(gòu)在探討調(diào)度優(yōu)化之前,
    發(fā)表于 08-23 17:51 ?390次閱讀

    函數(shù)計(jì)算性能福利篇(二) —— 業(yè)務(wù)冷啟動(dòng)優(yōu)化

    繼前一篇《函數(shù)計(jì)算性能福利篇——系統(tǒng)冷啟動(dòng)優(yōu)化》,我們?cè)賮砜纯唇?b class='flag-5'>函數(shù)計(jì)算推出的?Initializer 功能之后,帶來的一波高能性能優(yōu)化成
    發(fā)表于 12-13 18:02 ?255次閱讀

    DOS的冷啟動(dòng)和熱啟動(dòng)有什么區(qū)別和方法說明

    DOS的啟動(dòng)又可分為冷啟動(dòng)和熱啟動(dòng)。冷啟動(dòng)是指切斷電腦電源后重新開啟電源啟動(dòng)的過程。熱啟動(dòng)是指在
    發(fā)表于 08-14 17:32 ?0次下載
    DOS的<b class='flag-5'>冷啟動(dòng)</b>和熱<b class='flag-5'>啟動(dòng)</b>有什么區(qū)別和方法說明

    STM32冷啟動(dòng)下載

    冷啟動(dòng)和熱啟動(dòng)都是復(fù)位
    發(fā)表于 12-20 19:38 ?8次下載
    STM32<b class='flag-5'>冷啟動(dòng)</b>下載

    華為云發(fā)布冷啟動(dòng)加速解決方案:助力Serverless計(jì)算速度提升90%+

    子游: 華為元戎高級(jí)工程師 平山:華為云中間件 Serverless 負(fù)責(zé)人 琪君:華為元戎負(fù)責(zé)人 |? Key Takeaways 冷啟動(dòng) (Cold Start) 一直是 Serverless
    的頭像 發(fā)表于 01-19 16:15 ?937次閱讀

    Serverless 冷啟動(dòng):如何函數(shù)計(jì)算更快更強(qiáng)

    問題背景 Serverless 計(jì)算也稱服務(wù)器無感知計(jì)算函數(shù)計(jì)算,是近年來一種新興的編程模式。其致力于大幅簡(jiǎn)化云業(yè)務(wù)開發(fā)流程,使得應(yīng)用開發(fā)
    的頭像 發(fā)表于 09-06 23:08 ?390次閱讀
    <b class='flag-5'>Serverless</b> <b class='flag-5'>冷啟動(dòng)</b>:如何<b class='flag-5'>讓</b><b class='flag-5'>函數(shù)</b><b class='flag-5'>計(jì)算</b><b class='flag-5'>更快</b><b class='flag-5'>更強(qiáng)</b>?

    汽車電子應(yīng)用中的冷啟動(dòng)

    電子發(fā)燒友網(wǎng)站提供《汽車電子應(yīng)用中的冷啟動(dòng).pdf》資料免費(fèi)下載
    發(fā)表于 10-20 11:13 ?0次下載
    汽車電子應(yīng)用中的<b class='flag-5'>冷啟動(dòng)</b>

    基于DPU的容器冷啟動(dòng)加速解決方案

    Serverless計(jì)算方式,極大地簡(jiǎn)化了開發(fā)人員的工作,使他們能夠?qū)W⒂趹?yīng)用的構(gòu)建與運(yùn)行,而不再需要承擔(dān)服務(wù)器管理的負(fù)擔(dān)。 然而,F(xiàn)aaS模式也并非沒有缺陷,其中最為人詬病的便是“冷啟動(dòng)”問題。所謂
    的頭像 發(fā)表于 09-13 11:50 ?423次閱讀
    基于DPU的容器<b class='flag-5'>冷啟動(dòng)</b>加速解決方案