0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

通用緩存引擎cachelib介紹

SSDFans ? 來源:SSDFans ? 2023-07-27 09:02 ? 次閱讀

背景

網(wǎng)絡(luò)服務(wù)幾乎在系統(tǒng)架構(gòu)的每一層都依賴于緩存。大型網(wǎng)絡(luò)服務(wù)依靠緩存系統(tǒng)來實(shí)現(xiàn)高性能和高效率。例如,在Facebook,CDN緩存為70%的網(wǎng)絡(luò)請求提供服務(wù),將延遲降低了一個或多個數(shù)量級。一臺緩存服務(wù)器可以取代幾十臺后端數(shù)據(jù)庫服務(wù)器,實(shí)現(xiàn)20倍的吞吐量和超過80%的命中率。通常,每個緩存都是由一個不同的團(tuán)隊(duì)獨(dú)立實(shí)現(xiàn)和維護(hù)的,并且對其功能高度專業(yè)化。在Facebook,各種各樣的緩存系統(tǒng)構(gòu)成了系統(tǒng)架構(gòu)的一個組成部分。Facebook的架構(gòu)包括CDN緩存、鍵值應(yīng)用緩存、社交圖譜緩存和媒體緩存(圖1)。緩存在亞馬遜、Twitter、Reddit以及其他許多大型網(wǎng)絡(luò)服務(wù)中扮演著類似的角色。然而,每個團(tuán)隊(duì)獨(dú)立實(shí)現(xiàn)和維護(hù)的緩存系統(tǒng)存在重復(fù)的邏輯和功能,忽略了不同緩存系統(tǒng)共同面臨的困難挑戰(zhàn),大大增加了部署、維護(hù)和擴(kuò)展每個緩存所需的整體努力。

問題

1. 多種緩存系統(tǒng)的冗余

Facebook的每個緩存系統(tǒng)都是單獨(dú)實(shí)現(xiàn)的。例如,如圖1所示,F(xiàn)acebook分別設(shè)計(jì)了CDN緩存、鍵值緩存、社交圖譜緩存、存儲緩存、數(shù)據(jù)庫緩存,以及其他許多緩存。這些高度專業(yè)化的系統(tǒng)都需要一個高度專業(yè)化的緩存,以實(shí)現(xiàn)復(fù)雜的一致性協(xié)議,利用自定義的數(shù)據(jù)結(jié)構(gòu),并針對所需的硬件平臺進(jìn)行優(yōu)化。盡管這些緩存系統(tǒng)服務(wù)于不同的工作負(fù)載,需要不同的功能,但它們在設(shè)計(jì)和部署方面有許多共同的挑戰(zhàn)。所有這些系統(tǒng)每秒都要處理數(shù)以百萬計(jì)的查詢,緩存工作集大到需要同時使用閃存和DRAM進(jìn)行緩存,并且必須容忍因應(yīng)用程序更新而頻繁重啟,這在Facebook的生產(chǎn)環(huán)境中很常見。隨著Facebook的緩存系統(tǒng)數(shù)量的增加,為每個系統(tǒng)維持獨(dú)立的緩存實(shí)現(xiàn)變得難以維持。通過重復(fù)解決相同的工程難題,團(tuán)隊(duì)重復(fù)了彼此的努力,產(chǎn)生了多余的代碼。此外,維護(hù)獨(dú)立的緩存系統(tǒng)也阻礙了系統(tǒng)之間分享性能優(yōu)化帶來的效率提升。

3f43fb3a-2c17-11ee-a368-dac502259ad0.png

圖1 緩存類型

2. DRAM開銷

隨著傳統(tǒng)的動態(tài)隨機(jī)存取存儲器 (DRAM) 緩存變得更加昂貴并且需要更多的能力來擴(kuò)展。在大型服務(wù)器的場景下,全部采用DRAM作為緩存介質(zhì)是不現(xiàn)實(shí)的,這將會造成巨大的成本開銷。像 Facebook 這樣的公司正在探索硬件選擇,例如非易失性存儲器 (NVM) 驅(qū)動器來增強(qiáng)他們的緩存系統(tǒng)。這種 DRAM 和 NVM 混合模型向前邁進(jìn)了一步,但需要創(chuàng)新的緩存設(shè)計(jì)來利用混合緩存的全部潛力。

探索

1. 緩存數(shù)據(jù)集分布(冷熱)

工作負(fù)載的流行度分布衡量的是每個鍵在某個時間范圍內(nèi)的取樣跟蹤的頻率。這些頻率表明系統(tǒng)中不同對象的相對受歡迎程度。之前對CDN和網(wǎng)絡(luò)工作負(fù)載的測量表明,高度傾斜的Zipf分布是一種常見的流行分布。在Zipf分布中,"最受歡迎的20%的對象占了80%的請求"。圖2顯示了Facebook四個工作負(fù)載的對數(shù)尺度的流行分布。在這個尺度上,Zipf分布將是一條具有負(fù)斜率(-α)的直線。Lookaside是四個系統(tǒng)中唯一一個流行度分布為Zipfian的系統(tǒng),α接近于1。Storage的分布在分布的頭部更平坦,盡管尾部遵循Zipf分布。此外,盡管是Zip-fian分布,SocialGraph和CDN的分布分別表現(xiàn)為α=0.55和α=0.7。較低的α意味著明顯較高比例的請求進(jìn)入流行分布的尾部,這導(dǎo)致了更大的工作集。

3f74f85c-2c17-11ee-a368-dac502259ad0.png

圖2 數(shù)據(jù)集流行度分布

2. 緩存數(shù)據(jù)集分布流失(冷熱變化)

流失指的是由于新keys的引入和現(xiàn)有keys的流行程度隨著時間的推移而產(chǎn)生的工作集的變化。流行的YCSB工作負(fù)載生成器假設(shè)沒有流失,即每個密鑰在整個基準(zhǔn)期間保持同樣的流行。這個基準(zhǔn)和無流失假設(shè)被廣泛用于系統(tǒng)論文的評估中。

3f9e7a06-2c17-11ee-a368-dac502259ad0.png

圖3 流失程度

在Facebook的生產(chǎn)工作負(fù)載中體現(xiàn)出有很高程度的流失率。如果一個對象屬于收到最多請求的10%的對象,我們就定義它是受歡迎的。圖3顯示了流行對象的集合如何隨時間變化。例如,x=3處的藍(lán)條顯示了一個3小時前很受歡迎的對象仍然在前10%最多請求的對象中的概率。在所有的工作負(fù)載中,超過三分之二的熱門對象在一小時后就跌出了前10%的位置。這種高流失率與使用哪個小時作為基線、不同的百分比(例如前25%)以及不同的時間粒度(例如,10分鐘后,50%的熱門對象不再受歡迎)無關(guān)。這種高流失率增加了時間定位的重要性,使緩存策略更難根據(jù)過去的訪問模式來估計(jì)對象的受歡迎程度。

3. 緩存對象的粒度變化

除了受歡迎程度和流失率之外,對象的大小在緩存性能上也起著關(guān)鍵作用。圖4顯示了四個大型用例的對象大小分布。對于Storage和CDN,64KB和128KB的小塊非常常見,這是將大對象分成小塊的結(jié)果。對于Lookaside和SocialGraph,對象的大小跨越了七個數(shù)量級。

3fbff5e6-2c17-11ee-a368-dac502259ad0.png

圖4 緩存對象粒度分布

4.急促訪問

Facebook的工作負(fù)載流量是相當(dāng)突發(fā)性的。圖5顯示了與泊松到達(dá)序列相比的實(shí)際請求到達(dá)率,這通常是在系統(tǒng)評估中假設(shè)的。圖5顯示,實(shí)際到達(dá)率的變化比Poisson暗示的要大得多。這對CDN來說尤其明顯,它在相當(dāng)穩(wěn)定的請求率之上有急劇的流量爆發(fā)。多變的到達(dá)率使得緩存系統(tǒng)很難有足夠的資源來維持負(fù)載高峰期的低延遲。

3fdc87ba-2c17-11ee-a368-dac502259ad0.png

圖5 請求數(shù)量分布

方法和設(shè)計(jì)

1. 混合式緩存架構(gòu)

相對來說這些東西需要寫很多相同的緩存邏輯:換出策略,內(nèi)存使用,處理 empty cache 等,所以 Facebook 造了一套通用的 CacheLib,用來節(jié)省團(tuán)隊(duì)造輪子的功夫。同時,很重要的一點(diǎn)是對于 Flash 的使用。用 SSD/Flash 當(dāng)緩存,相對來說能夠提供較低的成本,和可以接受的性能。相對 DRAM,機(jī)器一般會提供更大的盤,同時,SSD 也會提供更低的成本和更可接受的性能。這套功能在 CacheLib 中叫做 HybridCache,CacheLib 允許指定存儲設(shè)備。CacheLib 對外提供的是 byte-addressable 的對象和 cache。它提供了一套線程安全的 api,來處理對應(yīng)的邏輯:

3fefd0fe-2c17-11ee-a368-dac502259ad0.png

圖6 API

此外,CacheLib 還給自定義的 Serialize/Deserialize 定義了接口,以便用戶塞一些自定義結(jié)構(gòu)體。

2.小對象緩存優(yōu)化 (Small Object Cache)

SOC存儲很多小對象,如果像LOC一樣存儲它們的索引,系統(tǒng)整個DRAM開銷會非常大。所以SOC使用了一個近似的索引來實(shí)現(xiàn)對應(yīng)的邏輯。如圖7所示,SOC 把小對象劃分成很多 sets,每個包含一個4kB page,按照FIFO存儲對象。每組有一個8 bytes的Bloom Filter。這里把key查一下Bloom Filter,如果不存在則返回不存在,否則讀取整個Page并順序掃描。

40100360-2c17-11ee-a368-dac502259ad0.png

圖7 小對象存儲示意圖

3. 大對象緩存優(yōu)化 (Large Object Cache)

LOC 存儲的都是 2kB 以上的對象。作者認(rèn)為,這些大對象讓用戶能夠在內(nèi)存中放置這些對象的 Index。具體的對象按照 4kb 的大小對齊。論文用了 4 bytes 的大小定位這部分的數(shù)據(jù):4 bytes最大能表示232個數(shù)據(jù),可以放 16T的數(shù)據(jù)了。

LOC 的內(nèi)存索引存儲,LOC 會主動把 SSD 劃分成不同的區(qū)域,根據(jù)這個來判斷大小。然后LOC對象的地址會對齊4kB,這大概是一個SSD Page的大小,這樣能夠保證一個 SSD Page 不會存儲過多的對象;同時地址對齊 4kB,減小地址對象的開銷。如果對象很大,那么它會連續(xù)跨多個頁,需要把他們都讀起來。如果一個cache read讀取有一個相同的hash key,這里會把Flash中的元數(shù)據(jù)讀起來。這里在元數(shù)據(jù)上需要存儲對應(yīng)的key。然后把這個key跟用戶請求的真實(shí) key 比較,判斷具體是否命中緩存。

這里還有一個 Erase 相關(guān)的優(yōu)化。LOC 的 Erase 是以 Block 為單位的,它默認(rèn) 16MB,但是是可配置的。這實(shí)際上相當(dāng)于 抹去 SSD 的 Block,通過這種方式來增加寫的順序?qū)?。如果淘汰出的對象是一個比較熱的對象,可能會重新加入 cache 中。

實(shí)驗(yàn)結(jié)果

實(shí)驗(yàn)性能對比包含三個方面,分別為緩存命中率、吞吐量和暖啟動。

緩存命中率和吞吐量性能:圖12顯示了8到144GB的緩存規(guī)模和1億個對象的典型工作集的命中率和吞吐量。Memcached和CacheLib實(shí)現(xiàn)了相似的命中率,Memcached在小的緩存大小時略高,在大的緩存大小時略低。在所有的緩存大小中,CacheLib實(shí)現(xiàn)了比Memcached更高的吞吐量,每秒鐘處理的請求比Memcached多60%。

40530b4c-2c17-11ee-a368-dac502259ad0.png

圖8 命中率和吞吐量實(shí)驗(yàn)結(jié)果圖

小對象緩存性能:圖9顯示,CacheLib對小對象的明確處理為Flash緩存提供了比NGINX和ATS更大的優(yōu)勢。當(dāng)對象的大小變大時,這種優(yōu)勢就會減弱。最終,對象的大小變得足夠大,以至于這三個系統(tǒng)都變成了網(wǎng)絡(luò)約束,其吞吐量急劇下降。

406b6a02-2c17-11ee-a368-dac502259ad0.png

圖9 小對象吞吐量實(shí)驗(yàn)結(jié)果

暖啟動:圖10顯示了L1和L2 SocialGraph緩存重啟時的命中率,而沒有執(zhí)行暖重啟。在沒有啟用這個功能的情況下,緩存重啟會導(dǎo)致命中率下降,然后慢慢恢復(fù)正常。這在二級混合緩存中尤其具有破壞性,因?yàn)榇笕萘康木彺婵赡苄枰獛滋鞎r間來 "熱身"。這樣的命中率下降可以轉(zhuǎn)化為后端系統(tǒng)的暫時過載,因?yàn)楹蠖讼到y(tǒng)假定有相對穩(wěn)定的到達(dá)率。

408bc9dc-2c17-11ee-a368-dac502259ad0.png

圖10 暖啟動實(shí)驗(yàn)結(jié)果

總結(jié)

Cachelib的出現(xiàn)避免了緩存系統(tǒng)重復(fù)造輪子的現(xiàn)象,降低了系統(tǒng)的冗余程度和開發(fā)維護(hù)成本。同時cachelib設(shè)計(jì)了混合式緩存架構(gòu),使用性價比高的SSD進(jìn)行混合式緩存,使得緩存系統(tǒng)的成本降低同時提升性能。與傳統(tǒng)的內(nèi)存作為緩存層相比,cachelib考慮到閃存的特性,進(jìn)行了小對象緩存優(yōu)化,并且在性能上有很大改進(jìn)。





審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 驅(qū)動器
    +關(guān)注

    關(guān)注

    53

    文章

    8264

    瀏覽量

    146750
  • DRAM芯片
    +關(guān)注

    關(guān)注

    1

    文章

    84

    瀏覽量

    18040
  • 緩存器
    +關(guān)注

    關(guān)注

    0

    文章

    63

    瀏覽量

    11679
  • CDN網(wǎng)絡(luò)
    +關(guān)注

    關(guān)注

    0

    文章

    11

    瀏覽量

    6796
  • 隨機(jī)存取存儲器

    關(guān)注

    0

    文章

    45

    瀏覽量

    9004

原文標(biāo)題:通用緩存引擎cachelib

文章出處:【微信號:SSDFans,微信公眾號:SSDFans】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    阿里巴巴開源的通用緩存訪問框架JetCache介紹

    摘要: JetCache是由阿里巴巴開源的通用緩存訪問框架,如果你對Spring Cache很熟悉的話,請一定花一點(diǎn)時間了解一下JetCache,它更好用。JetCache可以做類似Spring
    發(fā)表于 04-24 16:09

    介紹AWTK

    ZLG開源GUI引擎AWTK發(fā)布1.1版本一、介紹AWTK全稱Toolkit AnyWhere,是ZLG開發(fā)的開源GUI引擎,旨在為嵌入式系統(tǒng)、WEB、各種小程序、手機(jī)和PC打造的通用
    發(fā)表于 08-20 08:18

    請問AzureRTOS ThreadX/NetXDuo在通用字節(jié)池上緩存怎么樣

    。到目前為止沒問題,我已經(jīng)將 regon 設(shè)置為“設(shè)備”,這樣就無法緩存它們?,F(xiàn)在在 AzureRTOS NetXDuo 上似乎不需要 Rx_Buff,因?yàn)樗怯?AzureRTOS 的通用字節(jié)池分配
    發(fā)表于 12-19 06:29

    高速緩存Cache介紹

    什么是高速緩存?? 高速存儲器塊,包含地址信息(通常稱作TAG)和相關(guān)聯(lián)的數(shù)據(jù)。? 目的是提高對存儲器的平均訪問速度? 高速緩存的應(yīng)用基于下面兩個程序的局部性 :? 空間局部性:如果一個存儲器的位置
    發(fā)表于 09-07 08:22

    Mybatis緩存之一級緩存

    本文主要講mybatis的一級緩存,一級緩存是SqlSession級別的緩存。mybatis提供查詢緩存,用于減輕數(shù)據(jù)壓力,提高數(shù)據(jù)庫性能。mybaits提供一級
    發(fā)表于 11-27 20:44 ?1238次閱讀
    Mybatis<b class='flag-5'>緩存</b>之一級<b class='flag-5'>緩存</b>

    渲染中的幀緩存和深度緩存

    渲染涉及大量的緩存,這里緩存只是一個簡單的存有像素數(shù)據(jù)的矩形內(nèi)存塊,最重要緩存是幀緩存和深度緩存
    的頭像 發(fā)表于 05-14 11:44 ?6406次閱讀
    渲染中的幀<b class='flag-5'>緩存</b>和深度<b class='flag-5'>緩存</b>

    硬盤緩存有什么用

    硬盤緩存一般指高速緩沖存儲器。本視頻主要詳細(xì)介紹了硬盤緩存有什么用,分別有預(yù)讀取、是對寫入動作進(jìn)行緩存以及是臨時存儲最近訪問過的數(shù)據(jù)。
    的頭像 發(fā)表于 11-10 10:31 ?2.3w次閱讀

    緩存的基本原理 緩存的分類

    緩存的主要手段有:瀏覽器緩存、CDN、反向代理、本地緩存、分布式緩存、數(shù)據(jù)庫緩存。
    發(fā)表于 06-13 12:04 ?4802次閱讀

    基于鴻蒙適配移植的開源視頻緩存引擎項(xiàng)目案例

    項(xiàng)目介紹 項(xiàng)目名稱:開源視頻緩存引擎項(xiàng)目 所屬系列:鴻蒙的第三方組件適配移植 功能:支持自動緩存視頻并在斷網(wǎng)狀態(tài)下播放視頻 項(xiàng)目移植狀態(tài):完成 調(diào)用差異:無 開發(fā)版本:sdk5,Dev
    發(fā)表于 04-06 10:27 ?2次下載

    CacheLib可插入的進(jìn)程內(nèi)緩存引擎

    ./oschina_soft/CacheLib.zip
    發(fā)表于 06-16 09:08 ?1次下載
    <b class='flag-5'>CacheLib</b>可插入的進(jìn)程內(nèi)<b class='flag-5'>緩存</b><b class='flag-5'>引擎</b>

    使用Matlab實(shí)現(xiàn)了一個通用無源網(wǎng)絡(luò)仿真引擎

    本節(jié)主要是對通用無源電路網(wǎng)絡(luò)的原理圖構(gòu)建和電路仿真。主要介紹了電路方程的改進(jìn)節(jié)點(diǎn)法和原理圖構(gòu)建中所使用的圖論相關(guān)分析方法。最后結(jié)合實(shí)際濾波器電路,使用Matlab實(shí)現(xiàn)了一個通用無源網(wǎng)絡(luò)仿真引擎
    發(fā)表于 02-20 14:32 ?1023次閱讀
    使用Matlab實(shí)現(xiàn)了一個<b class='flag-5'>通用</b>無源網(wǎng)絡(luò)仿真<b class='flag-5'>引擎</b>

    如何在SpringBoot中解決Redis的緩存穿透等問題

    今天給大家介紹一下如何在SpringBoot中解決Redis的緩存穿透、緩存擊穿、緩存雪崩的問題。
    的頭像 發(fā)表于 04-28 11:35 ?752次閱讀

    Caffeine教程緩存介紹

    緩存(Cache)在代碼世界中無處不在。從底層的CPU多級緩存,到客戶端的頁面緩存,處處都存在著緩存的身影。緩存從本質(zhì)上來說,是一種空間換時
    的頭像 發(fā)表于 05-22 11:01 ?990次閱讀
    Caffeine教程<b class='flag-5'>緩存</b><b class='flag-5'>介紹</b>

    聊聊本地緩存和分布式緩存

    本地緩存 :應(yīng)用中的緩存組件,緩存組件和應(yīng)用在同一進(jìn)程中,緩存的讀寫非???,沒有網(wǎng)絡(luò)開銷。但各應(yīng)用或集群的各節(jié)點(diǎn)都需要維護(hù)自己的單獨(dú)緩存,無
    發(fā)表于 06-11 15:12 ?845次閱讀
    聊聊本地<b class='flag-5'>緩存</b>和分布式<b class='flag-5'>緩存</b>

    緩存之美——如何選擇合適的本地緩存?

    Guava cache是Google開發(fā)的Guava工具包中一套完善的JVM本地緩存框架,底層實(shí)現(xiàn)的數(shù)據(jù)結(jié)構(gòu)類似于ConcurrentHashMap,但是進(jìn)行了更多的能力拓展,包括緩存過期時間設(shè)置、緩存容量設(shè)置、多種淘汰策略、
    的頭像 發(fā)表于 11-17 14:24 ?387次閱讀
    <b class='flag-5'>緩存</b>之美——如何選擇合適的本地<b class='flag-5'>緩存</b>?