0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
电子发烧友
开通电子发烧友VIP会员 尊享10大特权
海量资料免费下载
精品直播免费看
优质内容免费畅学
课程9折专享价
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

RocketMQ on openEuler提供高性能消息隊(duì)列的穩(wěn)定性解決方案

openEuler ? 來(lái)源:openEuler ? 2023-06-28 10:57 ? 次閱讀

RocketMQ on openEuler,是一種將 RocketMQ 消息中間件通過(guò)容器化的方式部署在 openEuler 操作系統(tǒng)上運(yùn)行,借助 openEuler 系統(tǒng)對(duì)于 OS 緩存回收效率增強(qiáng)的內(nèi)核特性,提升消息中間件在面向超大規(guī)模高并發(fā)、高吞吐量、低延遲場(chǎng)景下穩(wěn)定性和可靠性的軟件解決方案。

RocketMQ 消息隊(duì)列在穩(wěn)壓測(cè)試中遇到的 OOM 問(wèn)題

移動(dòng)云 RocketMQ 消息隊(duì)列產(chǎn)品正式上線前,通過(guò)壓測(cè)工具,創(chuàng)建多組生產(chǎn)者/消費(fèi)者進(jìn)程對(duì) RocketMQ 獨(dú)享集群做多輪性能和穩(wěn)定性的壓力測(cè)試。

測(cè)試環(huán)境

590e597c-14dc-11ee-962d-dac502259ad0.jpg

壓測(cè)結(jié)果

在某次持續(xù)長(zhǎng)時(shí)間的壓測(cè)過(guò)程中,發(fā)現(xiàn)消息收發(fā)吞吐,在一段時(shí)間內(nèi)的某一時(shí)刻會(huì)出現(xiàn)大幅度 TPS(生產(chǎn)/消費(fèi))抖動(dòng)下降的現(xiàn)象,并且是周期性的。

5945ecb6-14dc-11ee-962d-dac502259ad0.png

移動(dòng)云 RocketMQ 消息隊(duì)列一直都比較穩(wěn)定運(yùn)行,為何在高并發(fā)的壓測(cè)下也會(huì)出現(xiàn) TPS 的抖動(dòng)?我們初步懷疑是 CPU 負(fù)載或者 RocketMQ Broker 組件 GC 頻率過(guò)高導(dǎo)致,但通過(guò)查看 CPU 負(fù)載和 JVM GC 頻率并未發(fā)現(xiàn)任何異常。最終,經(jīng)過(guò)排查發(fā)現(xiàn)是由于 Broker Pod 進(jìn)程中的 buff/cache 在持續(xù)長(zhǎng)時(shí)間壓測(cè)下不斷增加,系統(tǒng)無(wú)法及時(shí)有效回收,導(dǎo)致 Pod 中的運(yùn)行進(jìn)程占用內(nèi)存空間超出預(yù)先設(shè)置的 Limit 限制,觸發(fā)了 OOM Killer 機(jī)制重啟了 Broker Pod。

RocketMQ on openEuler—解決大規(guī)模高并發(fā)場(chǎng)景下提升穩(wěn)定性的新選擇

為何在持續(xù)高并發(fā)下進(jìn)行消息收發(fā)會(huì)導(dǎo)致系統(tǒng)的 buff/cache 的持續(xù)增加?通過(guò)翻閱操作系統(tǒng)手冊(cè),可知 buff/cache 主要體現(xiàn)在系統(tǒng)的 PageCache 上。

PageCache 在 RocketMQ 消息存儲(chǔ)中的重要作用

PageCache 也叫頁(yè)緩沖或文件緩沖,在 linux 讀寫(xiě)文件時(shí),它用于緩存文件的邏輯內(nèi)容,從而加快對(duì)磁盤(pán)上映像和數(shù)據(jù)的訪問(wèn)。

5973da0e-14dc-11ee-962d-dac502259ad0.png

上圖中,紅色部分即為,PageCache。可見(jiàn) PageCache 的本質(zhì)是由 Linux 內(nèi)核管理的內(nèi)存區(qū)域。平時(shí)我們寫(xiě)的各種程序,通過(guò) mmap 及 buffered I/O 將文件讀取到內(nèi)存空間實(shí)際上都是讀取到 PageCache 中。為了在大規(guī)模高并發(fā)場(chǎng)景下實(shí)現(xiàn)實(shí)現(xiàn)低延遲、高吞吐的目標(biāo),RocketMQ 消息隊(duì)列的存儲(chǔ)模塊主要采用如下兩種方案。

「Mmap + PageCache 的消息并發(fā)讀寫(xiě)方案」:在該方案中,消息的讀寫(xiě)流程都會(huì)經(jīng)過(guò) PageCache。在多線程并發(fā)讀寫(xiě)的場(chǎng)景下,PageCache 不可避免會(huì)有鎖的問(wèn)題,尤其是在維護(hù) PageCache 一致性時(shí),系統(tǒng)回刷臟頁(yè)時(shí)磁盤(pán)壓力較高,會(huì)導(dǎo)致出現(xiàn)毛刺現(xiàn)象。

「堆外內(nèi)存池化技術(shù) + PageCache 的消息讀寫(xiě)分離方案」:消息寫(xiě)入時(shí)候?qū)懼?RocketMQ 啟動(dòng)時(shí)創(chuàng)建的堆外內(nèi)存塊(DirectByteBuffer)中,同時(shí)消息從 PageCache 中讀取。這樣,消息讀寫(xiě)分離使得整體流程并發(fā)性更好,有效降低時(shí)延,同時(shí)利用堆外內(nèi)存池減少了用戶態(tài)與內(nèi)核態(tài)的切換開(kāi)銷(xiāo)。

PageCache 在 RocketMQ 消息隊(duì)列的存儲(chǔ)層扮演著舉足輕重的作用,一旦系統(tǒng)的 PageCache 出現(xiàn)問(wèn)題(如緩存回收、一致性和缺頁(yè)中斷等問(wèn)題),都會(huì)對(duì)消息收發(fā)的主要流程造成嚴(yán)重的影響。

openEuler 系統(tǒng)在緩存回收效率方面的優(yōu)化

為了防止 PageCache 申請(qǐng)過(guò)多(默認(rèn)無(wú)限制)將可靠?jī)?nèi)存耗盡,需要對(duì) PageCache 的總量及使用可靠?jī)?nèi)存總量進(jìn)行限制。相對(duì)于 CentOS 系統(tǒng)內(nèi)核無(wú)法對(duì)未超出 node 節(jié)點(diǎn)內(nèi)存資源的 PageCache 進(jìn)行及時(shí)回收,openEuler 針對(duì) PageCache 的回收增加了相關(guān)的系統(tǒng)內(nèi)核參數(shù),并為限制 PageCache 使用量的功能提供若干 proc 接口,接口定義在/proc/sys/vm/下,用來(lái)控制 PageCache 的使用量,具體如下:

59b07cc0-14dc-11ee-962d-dac502259ad0.png

「cache_reclaim_enable」:表示 PageCache 限制的功能的使能開(kāi)關(guān);

「cache_reclaim_s」:表示定期觸發(fā) cache 回收的時(shí)間,以秒為單位。系統(tǒng)會(huì)根據(jù)當(dāng)前 online 的 cpu 個(gè)數(shù)來(lái)創(chuàng)建工作隊(duì)列,如果有 n 個(gè) cpu 則創(chuàng)建 n 個(gè)工作隊(duì)列,每個(gè)工作隊(duì)列每隔 cache_reclaim_s 秒進(jìn)行一次回收。該參數(shù)與 cpu 上下線功能兼容,如果 cpu offline,則會(huì)減少工作隊(duì)列個(gè)數(shù);反之,cpu online 則會(huì)增加工作隊(duì)列個(gè)數(shù)。

「cache_reclaim_weight」:表示每次回收的權(quán)值,內(nèi)核每個(gè) CPU 每次期望回收 32 * cache_reclaim_weight 個(gè) page。該權(quán)值同時(shí)作用于 page 上限觸發(fā)的回收和定期 pageCache 回收;

RocketMQ on openEuler 方案在生產(chǎn)環(huán)境中的驗(yàn)證

為解決遇到的 OOM 問(wèn)題,我們針對(duì)獨(dú)享集群所在機(jī)器進(jìn)行了操作系統(tǒng)內(nèi)核版本的升級(jí),更新至最新的 BC-Linux for Euler 21.10 版本(BC-Linux for Euler 是移動(dòng)云操作系統(tǒng)團(tuán)隊(duì)以 openEuler 社區(qū)操作系統(tǒng)為基礎(chǔ),借助開(kāi)源社區(qū)的開(kāi)放優(yōu)勢(shì),通過(guò)定制化方式研發(fā)的企業(yè)級(jí) Linux 操作系統(tǒng))。更新系統(tǒng)后,采用兩種消息體(1Kb 和 4Kb)分別對(duì)同樣的測(cè)試環(huán)境進(jìn)行長(zhǎng)時(shí)間的壓測(cè)。

測(cè)試場(chǎng)景 1

測(cè)試消息大小 1Kb 消息收發(fā)性能及長(zhǎng)時(shí)間壓測(cè)穩(wěn)定性,測(cè)試中,獨(dú)享集群能夠達(dá)到收發(fā)消息總和 TPS 為 2w+TPS(其中發(fā)送消息 1w+TPS,消費(fèi)消息 1w+TPS)。消息生產(chǎn)和消費(fèi)的速度規(guī)律,如下圖所示:

59ca8fac-14dc-11ee-962d-dac502259ad0.png

從圖中可見(jiàn)在消息體大小為 1Kb 的消息時(shí),消息生產(chǎn)和消費(fèi)速度在長(zhǎng)時(shí)間壓測(cè)下沒(méi)有抖動(dòng),TPS 保持平穩(wěn),整個(gè)壓測(cè)時(shí)間服務(wù)正常。

測(cè)試場(chǎng)景 2

測(cè)試消息大小 4Kb 消息收發(fā)性能及長(zhǎng)時(shí)間壓測(cè)穩(wěn)定性,測(cè)試中,集群能夠達(dá)到收發(fā)消息總和 TPS 為 1.4w+ TPS(其中發(fā)送消息 0.7w+TPS,消費(fèi)消息 0.7w+TPS)。消息生產(chǎn)和消費(fèi)的速度規(guī)律,如下圖所示:

59faf926-14dc-11ee-962d-dac502259ad0.png

從圖中可見(jiàn)在消息體大小為 4Kb 的消息時(shí),消息生產(chǎn)和消費(fèi)速度長(zhǎng)時(shí)間壓測(cè)沒(méi)有抖動(dòng),TPS 保持平穩(wěn),整個(gè)壓測(cè)時(shí)間服務(wù)正常。

總結(jié)

移動(dòng)云 RocketMQ 消息隊(duì)列的獨(dú)享實(shí)例在 22 年已完成了云原生化的完全升級(jí),特別適合云原生、Serverless 化架構(gòu)和大數(shù)據(jù)流計(jì)算的技術(shù)演進(jìn)與相關(guān)應(yīng)用場(chǎng)景。目前,RocketMQ on openEuler 的解決方案已在廣州 3 AZ2、呼和浩特、北京、杭州等多個(gè)資源池上線且完成了部分存量服務(wù)器的遷移與改造升級(jí)。后續(xù),移動(dòng)云 RocketMQ 消息隊(duì)列并將不斷提升服務(wù)質(zhì)量,為廣大客戶創(chuàng)造更多的價(jià)值。歡迎大家多多關(guān)注。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 內(nèi)核
    +關(guān)注

    關(guān)注

    3

    文章

    1410

    瀏覽量

    41153
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    11051

    瀏覽量

    216180
  • 容器
    +關(guān)注

    關(guān)注

    0

    文章

    508

    瀏覽量

    22379
  • 消息隊(duì)列
    +關(guān)注

    關(guān)注

    0

    文章

    33

    瀏覽量

    3092
  • openEuler
    +關(guān)注

    關(guān)注

    2

    文章

    326

    瀏覽量

    6266

原文標(biāo)題:RocketMQ on openEuler 提供高性能消息隊(duì)列的穩(wěn)定性解決方案

文章出處:【微信號(hào):openEulercommunity,微信公眾號(hào):openEuler】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 0人收藏

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    LED燈具的性能穩(wěn)定性測(cè)試

    穩(wěn)定性測(cè)試。費(fèi)思方案設(shè)備:電源:FTG系列電源。FTP系列電源(供電)負(fù)載:FT6100系列多通道電子負(fù)載,(用于分配個(gè)通道電流)實(shí)現(xiàn)原理:負(fù)載能夠精準(zhǔn)快速的控制回路中的電流,實(shí)現(xiàn)恒流輸出。并且可以實(shí)現(xiàn)
    發(fā)表于 12-07 15:00

    高性能頻率補(bǔ)償使DC-DC轉(zhuǎn)換器具有75μs的高穩(wěn)定性響應(yīng)

    DN53- 高性能頻率補(bǔ)償使DC-DC轉(zhuǎn)換器具有75μs的高穩(wěn)定性響應(yīng)
    發(fā)表于 07-16 16:10

    電子穩(wěn)定性控制系統(tǒng)ESC解決方案

    電子穩(wěn)定性控制系統(tǒng)ESC解決方案 電子穩(wěn)定性控制系統(tǒng)(ESC)幫助駕駛員保持對(duì)于汽車(chē)的控制。通過(guò)采用一個(gè)微控制器,一套用于測(cè)量汽車(chē)輛橫向和縱向加速度
    發(fā)表于 04-12 15:22 ?5515次閱讀
    電子<b class='flag-5'>穩(wěn)定性</b>控制系統(tǒng)ESC<b class='flag-5'>解決方案</b>

    穩(wěn)定性的高速激光打碼機(jī)解決方案

    穩(wěn)定性的高速激光打
    發(fā)表于 01-07 17:13 ?0次下載
    高<b class='flag-5'>穩(wěn)定性</b>的高速激光打碼機(jī)<b class='flag-5'>解決方案</b>

    高性能慣性導(dǎo)航和穩(wěn)定性

    無(wú)人機(jī)和其他無(wú)人應(yīng)用需在惡劣環(huán)境中工作,為了滿足精密穩(wěn)定性和導(dǎo)航要求,能夠抑制振動(dòng)、沖擊和溫漂的高性能MEMS必不可少。
    的頭像 發(fā)表于 06-04 13:47 ?4763次閱讀

    滿足無(wú)人機(jī)應(yīng)用的高性能慣性導(dǎo)航和穩(wěn)定性高性能MEMS技術(shù)

    無(wú)人機(jī)和其他無(wú)人應(yīng)用需在惡劣環(huán)境中工作,為了滿足精密穩(wěn)定性和導(dǎo)航要求,能夠抑制振動(dòng)、沖擊和溫漂的高性能MEMS必不可少。
    的頭像 發(fā)表于 08-05 06:12 ?2763次閱讀

    什么是熱電偶穩(wěn)定性?如何檢測(cè)熱電偶穩(wěn)定性

    在規(guī)定的條件下,熱電特性變化大即表明穩(wěn)定性差,變化小則表明穩(wěn)定性良好。熱電偶的穩(wěn)定性好壞會(huì)直接影響到熱電偶測(cè)量的準(zhǔn)確性,因此,穩(wěn)定性是衡量熱電偶性能
    發(fā)表于 12-31 09:19 ?2894次閱讀
    什么是熱電偶<b class='flag-5'>穩(wěn)定性</b>?如何檢測(cè)熱電偶<b class='flag-5'>穩(wěn)定性</b>?

    DN53-高性能頻率補(bǔ)償為DC-DC轉(zhuǎn)換器提供75μs的高穩(wěn)定性響應(yīng)

    DN53-高性能頻率補(bǔ)償為DC-DC轉(zhuǎn)換器提供75μs的高穩(wěn)定性響應(yīng)
    發(fā)表于 04-30 10:01 ?9次下載
    DN53-<b class='flag-5'>高性能</b>頻率補(bǔ)償為DC-DC轉(zhuǎn)換器<b class='flag-5'>提供</b>75μs的高<b class='flag-5'>穩(wěn)定性</b>響應(yīng)

    HPC SIG致力openEuler上的高性能計(jì)算軟件生態(tài)

    提供的便捷、穩(wěn)定的相關(guān)開(kāi)源軟件包。 目前參與成員有華為 HPC 解決方案成員,并拓展了眾多高校參與,如上海交大、浙江大學(xué)、蘭州大學(xué)
    的頭像 發(fā)表于 09-26 09:37 ?2361次閱讀

    恒溫晶振對(duì)溫度穩(wěn)定性解決方案

    恒溫晶振(OCXO; KO系列) 對(duì)溫度穩(wěn)定性解決方案采用了恒溫槽技術(shù): 將晶體置于恒溫槽內(nèi),通過(guò)設(shè)置恒溫工作點(diǎn),使槽體保持恒溫狀態(tài)。
    的頭像 發(fā)表于 09-09 14:31 ?2198次閱讀

    怎么分析電路的穩(wěn)定性

    怎么分析電路的穩(wěn)定性?? 電路的穩(wěn)定性是指電路在不同條件下保持穩(wěn)定的能力。穩(wěn)定性是電路設(shè)計(jì)中十分重要的一個(gè)方面,因?yàn)?b class='flag-5'>穩(wěn)定的電路能夠
    的頭像 發(fā)表于 09-17 16:44 ?2600次閱讀

    如何權(quán)衡阻抗控制性能穩(wěn)定性的關(guān)系

    阻抗控制性能提升后對(duì)穩(wěn)定性有怎樣的影響?如何權(quán)衡阻抗控制性能穩(wěn)定性的關(guān)系? 當(dāng)阻抗控制性能提升時(shí),往往需要更高的控制增益來(lái)實(shí)現(xiàn)更快的響應(yīng)和
    的頭像 發(fā)表于 11-14 15:26 ?1443次閱讀
    如何權(quán)衡阻抗控制<b class='flag-5'>性能</b>與<b class='flag-5'>穩(wěn)定性</b>的關(guān)系

    IXXAT NT系列高穩(wěn)定性網(wǎng)關(guān)網(wǎng)橋解決方案

    IXXAT NT系列高穩(wěn)定性網(wǎng)關(guān)網(wǎng)橋解決方案
    的頭像 發(fā)表于 12-22 14:00 ?753次閱讀
    IXXAT NT系列高<b class='flag-5'>穩(wěn)定性</b>網(wǎng)關(guān)網(wǎng)橋<b class='flag-5'>解決方案</b>

    DC/DC轉(zhuǎn)換器中輸入濾波器穩(wěn)定性問(wèn)題的簡(jiǎn)單解決方案

    電子發(fā)燒友網(wǎng)站提供《DC/DC轉(zhuǎn)換器中輸入濾波器穩(wěn)定性問(wèn)題的簡(jiǎn)單解決方案.pdf》資料免費(fèi)下載
    發(fā)表于 10-14 10:05 ?0次下載
    DC/DC轉(zhuǎn)換器中輸入濾波器<b class='flag-5'>穩(wěn)定性</b>問(wèn)題的簡(jiǎn)單<b class='flag-5'>解決方案</b>

    庫(kù)存平臺(tái)穩(wěn)定性建設(shè)實(shí)踐

    作者:京東物流 尹昊喆 前言 本文總結(jié)庫(kù)存平臺(tái)穩(wěn)定性建設(shè)中遇到的問(wèn)題以及解決方案。感謝【金鵬】、【孫靜】、【陳瑞】同學(xué)在本文撰寫(xiě)中提供的內(nèi)容及幫助! 庫(kù)存平臺(tái)面臨的穩(wěn)定性挑戰(zhàn) 庫(kù)存平臺(tái)
    的頭像 發(fā)表于 12-11 09:50 ?511次閱讀
    庫(kù)存平臺(tái)<b class='flag-5'>穩(wěn)定性</b>建設(shè)實(shí)踐

    電子發(fā)燒友

    中國(guó)電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會(huì)員交流學(xué)習(xí)
    • 獲取您個(gè)性化的科技前沿技術(shù)信息
    • 參加活動(dòng)獲取豐厚的禮品