0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

華為云數(shù)據(jù)庫(kù)GaussDB(for Influx)揭秘:數(shù)據(jù)分級(jí)存儲(chǔ)

路過(guò)的憨憨 ? 來(lái)源:路過(guò)的憨憨 ? 作者:路過(guò)的憨憨 ? 2022-12-02 17:28 ? 次閱讀

華為云數(shù)據(jù)庫(kù)GaussDB揭秘:數(shù)據(jù)分級(jí)存儲(chǔ)

“只存儲(chǔ)這些數(shù)據(jù)一年就要花費(fèi)200多萬(wàn)?”

面對(duì)老板的質(zhì)疑,小王又重新講解了一遍評(píng)估方案。為了支撐生產(chǎn)分析和系統(tǒng)運(yùn)維,一個(gè)設(shè)備就需要幾十個(gè)檢測(cè)點(diǎn)數(shù)據(jù),所有設(shè)備24小時(shí)不斷采集數(shù)據(jù),一天的數(shù)據(jù)量就會(huì)達(dá)到TB級(jí),這些數(shù)據(jù)至少存儲(chǔ)2年,再加上高可用的3副本,總的數(shù)據(jù)量會(huì)達(dá)到PB級(jí)。

小王又展示了當(dāng)前云廠商存儲(chǔ)價(jià)格和性能對(duì)比的調(diào)研結(jié)果:

磁盤(pán)類(lèi)型

SATA——NVME

成本100G/月

9.9——100

IOPS

2200——50000

吞吐量

50M/s——350M/s

訪問(wèn)時(shí)延

5ms~10ms——1ms

不同存儲(chǔ)其性能差異很大。例如NVME盤(pán)的吞吐量是SATA盤(pán)的7倍,IOPS超過(guò)了20倍,當(dāng)然對(duì)應(yīng)的成本也高出10倍左右。根據(jù)測(cè)試評(píng)估,低成本的存儲(chǔ)性能無(wú)法滿足大量數(shù)據(jù)的寫(xiě)入和實(shí)時(shí)業(yè)務(wù)的監(jiān)控,只得使用性能高的SSD盤(pán),因此導(dǎo)致存儲(chǔ)的成本提高。

成本提高,老板自然不滿意。那如何才能既滿足性能需求,又能控制成本呢?小王想,“實(shí)際上,不是所有的數(shù)據(jù)處理都需要很高的性能,如果把價(jià)值高的數(shù)據(jù)放在高性能磁盤(pán)上滿足業(yè)務(wù)需求,價(jià)值低的數(shù)據(jù)放在低成本磁盤(pán)上降低成本,這樣不就既能滿足需求,又能降低成本了么?”

不過(guò),想法很美好,現(xiàn)實(shí)很殘酷,要實(shí)現(xiàn)這個(gè)方案,小王面臨著更多的難題:

(1)怎么在一套系統(tǒng)中既能使用高性能存儲(chǔ),又能使用低成本存儲(chǔ)?

(2)怎么區(qū)分高價(jià)值數(shù)據(jù)?

(3)高價(jià)值數(shù)據(jù)變成低價(jià)值數(shù)據(jù)后怎么自動(dòng)轉(zhuǎn)儲(chǔ)?

(4)當(dāng)前業(yè)務(wù)改造量要盡量少。

1.GaussDB(for Influx)解決方案

企業(yè)的數(shù)字化轉(zhuǎn)型,數(shù)據(jù)是基礎(chǔ)。為了能實(shí)時(shí)掌握設(shè)備、系統(tǒng)狀態(tài),需要采集大量的數(shù)據(jù)并進(jìn)行實(shí)時(shí)處理。這些數(shù)據(jù)都屬于時(shí)序數(shù)據(jù),帶有明顯的特點(diǎn),如時(shí)間戳、更新少、數(shù)據(jù)源唯一等。除了數(shù)據(jù)本身的特點(diǎn),在業(yè)務(wù)應(yīng)用上還具有如下特點(diǎn):

  • 隨著時(shí)間的推移,其被查詢和分析的概率越來(lái)越低。
  • 隨著時(shí)間的推移,對(duì)數(shù)據(jù)分析的實(shí)時(shí)性要求越來(lái)越低。
  • 隨著時(shí)間的推移,數(shù)據(jù)的精度要求越來(lái)越低。
  • 數(shù)據(jù)只保留一段時(shí)間,到期后會(huì)刪除。

如何結(jié)合時(shí)序數(shù)據(jù)的特點(diǎn),實(shí)現(xiàn)小王既滿足業(yè)務(wù)性能,又控制成本的美好愿望呢?華為云GaussDB(for Influx)時(shí)序數(shù)據(jù)庫(kù)的數(shù)據(jù)分級(jí)存儲(chǔ)功能完美解決了困擾小王的問(wèn)題。

  1. 華為云GaussDB(for Influx)依托云原生能力,實(shí)現(xiàn)了計(jì)算存儲(chǔ)分離的分布式架構(gòu),其中存儲(chǔ)基于華為分布式存儲(chǔ)DFV和對(duì)象存儲(chǔ)OBS,解決了在一套系統(tǒng)中既能使用高性能存儲(chǔ),又能使用低成本存儲(chǔ)的問(wèn)題,其具體架構(gòu)如下圖:

1669973295015vi4fcrdq2w

分布式DFV存儲(chǔ)屬于高性能存儲(chǔ),熱數(shù)據(jù)放在DFV中確保業(yè)務(wù)性能要求;OBS存儲(chǔ)屬于低成本存儲(chǔ),冷數(shù)據(jù)存儲(chǔ)在OBS中,降低客戶成本。

  1. 提供了冷熱數(shù)據(jù)自動(dòng)分離的方案,用戶在創(chuàng)建保留策略時(shí),可以指定冷熱數(shù)據(jù)的劃分時(shí)間,系統(tǒng)根據(jù)用戶的指定,自動(dòng)將數(shù)據(jù)分為熱數(shù)據(jù)和冷數(shù)據(jù),解決了數(shù)據(jù)如何劃分的問(wèn)題。
  2. 隨著時(shí)間的推移,熱數(shù)據(jù)轉(zhuǎn)冷,系統(tǒng)會(huì)自動(dòng)將數(shù)據(jù)轉(zhuǎn)儲(chǔ)到冷存儲(chǔ)上。
  3. 上述過(guò)程中只有在創(chuàng)建RP時(shí)需要指定冷熱數(shù)據(jù)策略。對(duì)于業(yè)務(wù)側(cè)是不感知的,避免業(yè)務(wù)的適配和改造。

2.GaussDB(for Influx)冷熱存儲(chǔ)的使用

GaussDB(for Influx)存儲(chǔ)分級(jí)功能使用十分方便,在購(gòu)買(mǎi)冷存儲(chǔ)后,設(shè)置RP策略時(shí)指定冷存儲(chǔ)的時(shí)間即可,系統(tǒng)會(huì)根據(jù)RP策略,自動(dòng)將冷數(shù)據(jù)轉(zhuǎn)儲(chǔ)到底成本存儲(chǔ)上。業(yè)務(wù)在訪問(wèn)冷數(shù)據(jù)時(shí),系統(tǒng)會(huì)自動(dòng)去冷存儲(chǔ)上讀取,整個(gè)過(guò)程業(yè)務(wù)是不感知的,對(duì)業(yè)務(wù)無(wú)影響。

2.1購(gòu)買(mǎi)冷存儲(chǔ)

GaussDB(for Influx)支持一鍵購(gòu)買(mǎi)冷存儲(chǔ)空間,可以在購(gòu)買(mǎi)實(shí)例時(shí)選擇是否夠買(mǎi)冷存儲(chǔ),選擇“是”,可以根據(jù)業(yè)務(wù)需求選擇冷存儲(chǔ)的大小,具體如下圖:

1669973295338j8ospjaw2x

也可以在購(gòu)買(mǎi)實(shí)例后,獨(dú)立購(gòu)買(mǎi)冷存儲(chǔ)。進(jìn)入實(shí)例詳情頁(yè)面,點(diǎn)擊創(chuàng)建冷存儲(chǔ)空間,如下圖:

1669973295632l6yi64pf2z

跳轉(zhuǎn)到如下頁(yè)面,按照業(yè)務(wù)需求進(jìn)行存儲(chǔ)空間大小選擇:

1669973295907s8g3mt11po

冷存儲(chǔ)空也支持在線擴(kuò)容,擴(kuò)容過(guò)程中不影響業(yè)務(wù)。

2.2設(shè)置冷數(shù)據(jù)規(guī)則

在購(gòu)買(mǎi)了冷存儲(chǔ)空間后,就可以按照業(yè)務(wù)需求設(shè)置冷數(shù)據(jù)的規(guī)則,系統(tǒng)會(huì)根據(jù)規(guī)則,自動(dòng)劃分冷熱數(shù)據(jù),并將冷數(shù)據(jù)存儲(chǔ)在冷存儲(chǔ)空間上??梢酝ㄟ^(guò)創(chuàng)建RP來(lái)指定冷熱數(shù)據(jù)規(guī)則,具體示例如下:

//在db名為mydb上創(chuàng)建名為myrp的RP,顯示指定WARM DURATION為6d,表示6天前的數(shù)據(jù)是冷數(shù)據(jù)。

create retention policy myrp on mydb duration 30d replication 1 warm duration 6d shard duration 3d

//在db名為mydb上創(chuàng)建名為myrp的RP,沒(méi)有指定WARM DURATION,表示沒(méi)有冷數(shù)據(jù)。

create retention policy myrp on mydb duration 30d replication 1 shard duration 3d

//創(chuàng)建名為mydb的db,并帶有名為myrp的RP,顯示指定WARM DURATION為3d,表示3天前的數(shù)據(jù)是冷數(shù)據(jù)。

create database mydb with duration 6d warm duration 3d name myrp

//修改WARM DURATION為7d,表示7天前的數(shù)據(jù)是冷數(shù)據(jù)。

alter retention policy myrp on mydb warm duration 7d

規(guī)則設(shè)置完成后,系統(tǒng)會(huì)根據(jù)指定的規(guī)則,自動(dòng)判斷哪些數(shù)據(jù)屬于冷數(shù)據(jù),并自動(dòng)將數(shù)據(jù)轉(zhuǎn)儲(chǔ)到冷存儲(chǔ)上。

2.3使用效果驗(yàn)證

冷數(shù)據(jù)規(guī)則設(shè)置好,插入數(shù)據(jù)一段時(shí)間后,系統(tǒng)會(huì)自動(dòng)判斷數(shù)據(jù)是否轉(zhuǎn)為冷數(shù)據(jù),如果已經(jīng)成為冷數(shù)據(jù),系統(tǒng)會(huì)自動(dòng)將數(shù)據(jù)轉(zhuǎn)儲(chǔ)到冷存儲(chǔ)上。可以通過(guò)show shards命令來(lái)查看數(shù)據(jù)的狀態(tài),如下圖所示:

> show shards

name: hsdb

id database retention_policy shard_group start_time end_time expiry_time owners tier

-- -------- ---------------- ----------- ---------- -------- ----------- ------ ----

5 hsdb myrp 2 2019-08-12T00:00:00Z 2019-08-19T00:00:00Z 2019-08-19T00:00:00Z 4 cold

6 hsdb myrp 2 2019-08-12T00:00:00Z 2019-08-19T00:00:00Z 2019-08-19T00:00:00Z 5 moving

7 hsdb myrp 2 2019-08-12T00:00:00Z 2019-08-19T00:00:00Z 2019-08-19T00:00:00Z 6 warm

8 hsdb myrp 2 2019-08-12T00:00:00Z 2019-08-19T00:00:00Z 2019-08-19T00:00:00Z 7 cold

cold:表示數(shù)據(jù)為冷數(shù)據(jù),已存儲(chǔ)在冷存儲(chǔ)中;

moving:表示數(shù)據(jù)為冷數(shù)據(jù),該數(shù)據(jù)正在轉(zhuǎn)儲(chǔ)到冷存儲(chǔ)中;

warm:表示數(shù)據(jù)為熱數(shù)據(jù)。

3.總結(jié)

在應(yīng)用了GaussDB(for Influx)的冷熱分級(jí)存儲(chǔ)方案后,存儲(chǔ)100T的數(shù)據(jù)量一年,按照1個(gè)月內(nèi)的數(shù)據(jù)是熱數(shù)據(jù),其余是冷數(shù)據(jù),其總體的存儲(chǔ)成本從250萬(wàn)降至37.5萬(wàn),可節(jié)省85%的存儲(chǔ)成本。

GaussDB(for Influx)除了冷熱分級(jí)存儲(chǔ)功能外,在集群化、讀寫(xiě)性能、壓縮率、高可用方面也做了深度優(yōu)化,能更好地滿足時(shí)序應(yīng)用的各種場(chǎng)景。

審核編輯 黃昊宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 存儲(chǔ)
    +關(guān)注

    關(guān)注

    13

    文章

    4340

    瀏覽量

    86009
  • 華為云
    +關(guān)注

    關(guān)注

    3

    文章

    2673

    瀏覽量

    17505
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    分布式數(shù)據(jù)庫(kù)有哪些類(lèi)型

    分布式數(shù)據(jù)庫(kù)有哪些類(lèi)型?分布式數(shù)據(jù)庫(kù)主要類(lèi)型包括:關(guān)系型分布式數(shù)據(jù)庫(kù)、非關(guān)系型分布式數(shù)據(jù)庫(kù)
    的頭像 發(fā)表于 01-15 09:43 ?61次閱讀

    構(gòu)建數(shù)據(jù)庫(kù)解決方案,基于華為 Flexus X 實(shí)例容器化 MySQL 主從同步架構(gòu)

    前言**** 華為 Flexus X 實(shí)例,融合柔性算力與智能調(diào)度,為數(shù)據(jù)庫(kù)解決方案帶來(lái)全新突破。采用容器化 MySQL 主從同步架構(gòu),實(shí)現(xiàn)數(shù)據(jù)高效備份與讀寫(xiě)分離,保障業(yè)務(wù)連續(xù)性與
    的頭像 發(fā)表于 01-07 17:22 ?154次閱讀
    構(gòu)建<b class='flag-5'>數(shù)據(jù)庫(kù)</b>解決方案,基于<b class='flag-5'>華為</b><b class='flag-5'>云</b> Flexus X 實(shí)例容器化 MySQL 主從同步架構(gòu)

    數(shù)據(jù)庫(kù)是哪種數(shù)據(jù)庫(kù)類(lèi)型?

    數(shù)據(jù)庫(kù)是一種部署在虛擬計(jì)算環(huán)境中的數(shù)據(jù)庫(kù),它融合了計(jì)算的彈性和可擴(kuò)展性,為用戶提供高效、靈活的數(shù)據(jù)庫(kù)服務(wù)。
    的頭像 發(fā)表于 01-07 10:22 ?105次閱讀

    華為榮登Gartner?數(shù)據(jù)庫(kù)挑戰(zhàn)者象限

    近日,全球知名的信息技術(shù)研究與顧問(wèn)公司Gartner?正式發(fā)布了其備受矚目的2024年度《數(shù)據(jù)庫(kù)管理系統(tǒng)魔力象限報(bào)告》。在這份權(quán)威報(bào)告中,華為憑借其卓越的表現(xiàn)成功入選挑戰(zhàn)者象限,彰
    的頭像 發(fā)表于 12-31 13:57 ?161次閱讀

    使用華為 X 實(shí)例部署圖數(shù)據(jù)庫(kù) Virtuoso 并存儲(chǔ) 6500 萬(wàn)條大數(shù)據(jù)的完整過(guò)程與性能測(cè)評(píng)

    前言 ? 1. 部署Virtuoso圖數(shù)據(jù)庫(kù)的準(zhǔn)備工作 ? 1.1 選擇華為X實(shí)例的原因 ? 1.2 Virtuoso圖數(shù)據(jù)庫(kù)簡(jiǎn)介 ? 1.3 環(huán)境準(zhǔn)備與系統(tǒng)配置 ? 2. Virt
    的頭像 發(fā)表于 12-25 17:51 ?241次閱讀
    使用<b class='flag-5'>華為</b><b class='flag-5'>云</b> X 實(shí)例部署圖<b class='flag-5'>數(shù)據(jù)庫(kù)</b> Virtuoso 并<b class='flag-5'>存儲(chǔ)</b> 6500 萬(wàn)條大<b class='flag-5'>數(shù)據(jù)</b>的完整過(guò)程與性能測(cè)評(píng)

    數(shù)據(jù)庫(kù)主機(jī)哪個(gè)好一點(diǎn)?

    數(shù)據(jù)庫(kù)主機(jī)哪個(gè)好一點(diǎn)?主機(jī)和數(shù)據(jù)庫(kù)各有優(yōu)勢(shì),選擇哪個(gè)更好取決于具體需求。
    的頭像 發(fā)表于 12-04 13:50 ?159次閱讀

    數(shù)據(jù)庫(kù)數(shù)據(jù)恢復(fù)—通過(guò)拼接數(shù)據(jù)庫(kù)碎片恢復(fù)SQLserver數(shù)據(jù)庫(kù)

    一個(gè)運(yùn)行在存儲(chǔ)上的SQLServer數(shù)據(jù)庫(kù),有1000多個(gè)文件,大小幾十TB。數(shù)據(jù)庫(kù)每10天生成一個(gè)NDF文件,每個(gè)NDF幾百GB大小。數(shù)據(jù)庫(kù)包含兩個(gè)LDF文件。
    的頭像 發(fā)表于 10-31 13:21 ?289次閱讀
    <b class='flag-5'>數(shù)據(jù)庫(kù)</b><b class='flag-5'>數(shù)據(jù)</b>恢復(fù)—通過(guò)拼接<b class='flag-5'>數(shù)據(jù)庫(kù)</b>碎片恢復(fù)SQLserver<b class='flag-5'>數(shù)據(jù)庫(kù)</b>

    數(shù)據(jù)庫(kù)可以租用嗎?完整租用流程來(lái)了

    數(shù)據(jù)庫(kù)是可以租用的,這是一種合法且便捷的數(shù)據(jù)存儲(chǔ)和管理方式。數(shù)據(jù)庫(kù)
    的頭像 發(fā)表于 10-28 09:54 ?195次閱讀

    科技報(bào)到:大模型時(shí)代下,向量數(shù)據(jù)庫(kù)的野望

    科技報(bào)到:大模型時(shí)代下,向量數(shù)據(jù)庫(kù)的野望
    的頭像 發(fā)表于 10-14 17:18 ?271次閱讀

    一文講清什么是分布式數(shù)據(jù)庫(kù)

    分布式數(shù)據(jù)庫(kù)是一種先進(jìn)的數(shù)據(jù)管理系統(tǒng),它將傳統(tǒng)的數(shù)據(jù)庫(kù)技術(shù)與分布式計(jì)算、計(jì)算和大數(shù)據(jù)處理技
    的頭像 發(fā)表于 10-14 10:06 ?241次閱讀

    基于分布式存儲(chǔ)WDS的金融信創(chuàng)承載數(shù)據(jù)庫(kù)類(lèi)關(guān)鍵應(yīng)用

    基于分布式存儲(chǔ)WDS的金融信創(chuàng)承載數(shù)據(jù)庫(kù)類(lèi)關(guān)鍵應(yīng)用
    的頭像 發(fā)表于 08-16 09:42 ?297次閱讀
    基于分布式<b class='flag-5'>存儲(chǔ)</b>WDS的金融信創(chuàng)<b class='flag-5'>云</b>承載<b class='flag-5'>數(shù)據(jù)庫(kù)</b>類(lèi)關(guān)鍵應(yīng)用

    華為GaussDB數(shù)據(jù)庫(kù)基礎(chǔ)版發(fā)布:旗艦性能、價(jià)格下降超60%

    高性價(jià)比:相比企業(yè)版,華為 GaussDB 基礎(chǔ)版價(jià)格大幅下調(diào)(降幅達(dá) 60%-70%),且支持全場(chǎng)景數(shù)據(jù)壓縮,具有“超高壓縮比”,性能影響僅為 5%-10%,
    的頭像 發(fā)表于 05-07 14:21 ?666次閱讀

    華為多模數(shù)據(jù)庫(kù) GeminiDB 架構(gòu)與應(yīng)用實(shí)踐直播問(wèn)答實(shí)錄

    多模數(shù)據(jù)庫(kù)作為一種新興的數(shù)據(jù)管理解決方案,正在受到越來(lái)越多的關(guān)注。而華為多模數(shù)據(jù)庫(kù) GeminiDB 基于云原生
    的頭像 發(fā)表于 04-08 18:25 ?1186次閱讀

    華為云原生多模數(shù)據(jù)庫(kù) GeminiDB 架構(gòu)與應(yīng)用實(shí)踐

    近日,2023 全球分布式大會(huì)·深圳站順利召開(kāi),華為 NoSQL 數(shù)據(jù)庫(kù)研發(fā)總監(jiān)余汶龍?jiān)跁?huì)上發(fā)表了題為《華為云原生多模
    的頭像 發(fā)表于 04-08 18:23 ?1201次閱讀
    <b class='flag-5'>華為</b>云原生多模<b class='flag-5'>數(shù)據(jù)庫(kù)</b> GeminiDB 架構(gòu)與應(yīng)用實(shí)踐

    選擇 KV 數(shù)據(jù)庫(kù)最重要的是什么?

    最后我也沒(méi)問(wèn)清楚他們業(yè)務(wù)存啥(推測(cè)是這塊業(yè)務(wù)數(shù)據(jù)比較機(jī)密),但確實(shí)業(yè)務(wù)本身對(duì)可靠性要求非常高,開(kāi)源 Redis 自身的可靠性無(wú)法滿足他們的要求,最終該用戶選擇使用 GaussDB(for Redis)數(shù)據(jù)庫(kù),當(dāng)前
    的頭像 發(fā)表于 03-28 22:11 ?720次閱讀
    選擇 KV <b class='flag-5'>數(shù)據(jù)庫(kù)</b>最重要的是什么?