初識華為云數(shù)據(jù)庫GaussDB(for Cassandra
“l(fā)ocal quorum查詢某個分區(qū)鍵的條數(shù),每次查詢,條數(shù)都不一樣。”
“按這個分區(qū)鍵的token修復(fù),直接瞬間修復(fù)結(jié)束。但是再查,還是每次查詢條數(shù)不一致?!?/p>
“之前遇到墓碑丟失的問題,單個token查詢結(jié)果不一致,修復(fù)也解決不了”
…..
不用再為數(shù)據(jù)不一致苦惱,因為強一致的Cassandra來了,DBA們不用加班修數(shù)據(jù)了。
GaussDB(for Cassandra)是一款基于華為自主研發(fā)的計算存儲分離架構(gòu)的分布式云數(shù)據(jù)庫服務(wù)。是一個強一致性的系統(tǒng),在華為云高性能、高可用、高可靠、高安全、可彈性伸縮的基礎(chǔ)上,提供了一鍵部署、備份恢復(fù)、監(jiān)控報警等服務(wù)能力。高度兼容開源Cassandra接口,并提供高讀寫性能,具有高性價比,適用于IoT、氣象、互聯(lián)網(wǎng)、游戲等領(lǐng)域。
本文將從架構(gòu)、主要特性、競爭力、應(yīng)用場景等方面進行介紹。
設(shè)計架構(gòu):
GaussDB(for Cassandra)基于計算存儲分離架構(gòu),該架構(gòu)基于華為內(nèi)部強大且廣泛使用的自研分布式存儲系統(tǒng)DFV(數(shù)據(jù)功能虛擬化/Data Function Virtualisation),實現(xiàn)了一套Share Everything的云開源架構(gòu),充分發(fā)揮了云開源的彈性伸縮、資源共享的優(yōu)勢,高度兼容Cassandra協(xié)議,擁有超強寫入性能,同時相比社區(qū)版具有分鐘級計算擴容、秒級存儲擴容、數(shù)據(jù)強一致等優(yōu)勢,性能更強更穩(wěn)定,數(shù)據(jù)更可靠,擴容更敏捷,適用于IoT、實時推薦、金融反欺詐檢測等場景。
GaussDB(for Cassandra)牛在哪?
高可靠:數(shù)據(jù)強一致,提供企業(yè)級數(shù)據(jù)可靠性
開源Cassandra讀寫數(shù)據(jù)采用最終一致性,此處用讀場景舉例:如果讀一致性要求為ONE,會立即返回離客戶端最近的一份數(shù)據(jù)副本,那么這意味著第一次讀取到的數(shù)據(jù)可能不是最新的數(shù)據(jù)。如果讀一致性要求為QUORUM(即讀取任一數(shù)據(jù)中心中quorum數(shù)量的節(jié)點的結(jié)果,返回合并后timestamp最新的結(jié)果),則內(nèi)核會自動觸發(fā)讀修復(fù),然后返回給客戶端。假如此時有副本所在節(jié)點出現(xiàn)壞盤,在gc_graces的周期內(nèi)沒有完成數(shù)據(jù)修復(fù),部分副本屬于壞盤節(jié)點的業(yè)務(wù)數(shù)據(jù),業(yè)務(wù)查詢過程中發(fā)現(xiàn)數(shù)據(jù)會概率性不正確。
GaussDB(for Cassandra)采用存算分離架構(gòu),數(shù)據(jù)的副本在DFV存儲平臺保證,對計算節(jié)點來說數(shù)據(jù)單副本、數(shù)據(jù)強一致,查詢只需要從協(xié)調(diào)節(jié)點直接到數(shù)據(jù)節(jié)點取數(shù)據(jù)即可完成,規(guī)避了數(shù)據(jù)不一致修復(fù)數(shù)據(jù)造成的人力成本、業(yè)務(wù)查詢過程中發(fā)現(xiàn)數(shù)據(jù)會概率性不正確等問題。另外支持N-1個節(jié)點故障容忍,提供10倍以上的故障重構(gòu)性能和備份恢復(fù)性能,保證數(shù)據(jù)的可靠性。
高擴展:秒級擴容,快速更神速
開源Cassandra采用一致性Hash算法對數(shù)據(jù)進行分區(qū)打散,整個環(huán)代表數(shù)據(jù)從負無窮到正無窮區(qū)間。集群中每個節(jié)點會有虛擬節(jié)點(Token)在環(huán)上,虛擬節(jié)點的數(shù)量可配置。黃圈代表節(jié)點1,藍圈代表要擴容的節(jié)點2,2個Token之間組成整個數(shù)據(jù)的其中一段Range區(qū)間,擴容后加入了新的Token,會產(chǎn)生新的Range,這些Range中的一部分會歸新節(jié)點2管理。那么就需要把數(shù)據(jù)從節(jié)點1遷移到新節(jié)點2上去。遷移是通過讀取節(jié)點1上的數(shù)據(jù)寫入到節(jié)點2上,遷移的速度可以通過配置參數(shù)調(diào)整,整體遷移的時間由數(shù)據(jù)量與遷移過程中的讀寫速率有關(guān)。
GaussDB(for Cassandra)把多副本策略下沉到共享存儲,大幅提升彈性伸縮能力,如圖右側(cè)展示,新擴容的節(jié)點2只需要重新映射Token2到節(jié)點2,就可以完成,無需做數(shù)據(jù)的讀取與寫入的搬遷動作,實現(xiàn)分鐘級計算擴容,相比開源擴容時間提升幾十倍。隨著業(yè)務(wù)的不斷增長,Cassandra可以分鐘級水平彈性資源擴展。在類似圣誕節(jié)等熱門節(jié)日,提前1天進行彈性擴容,為業(yè)務(wù)高峰預(yù)留資源,業(yè)務(wù)高峰過后進行縮容,這些對業(yè)務(wù)無感知。計算節(jié)點可以通過文件系統(tǒng)控制集群在DFV中的數(shù)據(jù)使用量,擴容縮容磁盤時通過重新分配最大使用量,可實現(xiàn)秒級存儲擴容,單實例支持海量數(shù)據(jù)存儲。
高性能:超高寫入,讀性能數(shù)倍提升
GaussDB(for Cassandra)在超強寫入性能的基礎(chǔ)上,通過使用C語言重構(gòu)存儲引擎,減少系統(tǒng)GC,實現(xiàn)了數(shù)倍讀性能提升,拓寬了使用場景的外延,使其不僅僅適用于寫密集型的業(yè)務(wù)場景,在讀密集的場景中也具備了強競爭優(yōu)勢,整體性能超越開源自建2~3倍。
高安全:構(gòu)筑多層保護,為數(shù)據(jù)安全保駕護航
GaussDB(for Cassandra)通過VPC、子網(wǎng)、安全組、DDoS防護以及SSL安全訪問等多層安全防護體系,幫助用戶抵御網(wǎng)絡(luò)攻擊,讓用戶上云無憂。
為什么選擇GaussDB(for Cassandra)?
能力
技術(shù)能力對比
開源自建Cassandra
GaussDB(for Cassandra)
自動備份能力、PITR
×
√
超大數(shù)據(jù)量及復(fù)雜查詢支持
×
√
流表(數(shù)據(jù)變更捕獲)
×
√
離線分析
不完善
√
高可靠:雙向數(shù)據(jù)同步、無損升級
×
√
分鐘級擴容
×
√
全局索引
不完善
√
數(shù)據(jù)強一致
×
√
適用多種場景
工業(yè)制造&氣象業(yè)
隨著科技進度,采集的氣象數(shù)據(jù)指數(shù)增長,需要一種系統(tǒng)對地面、高空、海洋、重要天氣報、閃電、環(huán)境監(jiān)測等衛(wèi)星、雷達采集的數(shù)據(jù)能夠高性能寫入、查詢、在線、離線分析。
1.需要存儲對地面、高空、海洋、重要天氣報、閃電、環(huán)境監(jiān)測等衛(wèi)星、雷達等降雨量、濕度、溫度等PB級數(shù)據(jù)量
2.支撐來自各氣象采集點數(shù)據(jù)高并發(fā)寫入到Cassandra,GaussDB(for Cassandra)集群性能高于自建2~3倍,更適合高并發(fā)寫入讀取
3.GaussDB(for Cassandra)數(shù)據(jù)能夠支撐實時在線分析,為氣象算法、天氣預(yù)報做到實時精準分析
4.訪問數(shù)據(jù)庫進行離線數(shù)據(jù)分析,GaussDB(for Cassandra)能將離線分析時效縮短到60%
互聯(lián)網(wǎng)
GaussDB(for Cassandra)具備高并發(fā)寫入性能和高可擴展性,保障集群高可用和業(yè)務(wù)連續(xù)穩(wěn)定性,非常適用于寫入規(guī)模量較大的互聯(lián)網(wǎng)大數(shù)據(jù)場景,如記錄大規(guī)模的用戶行為數(shù)據(jù)等。
1.存放用戶畫像數(shù)據(jù),能夠完美解決特征:數(shù)據(jù)量大、可以應(yīng)對數(shù)據(jù)結(jié)構(gòu)Scheme頻繁變更
2.查詢性能要求高;比如要買一雙鞋,搜索出的鞋子數(shù)據(jù)會根據(jù)用戶畫像的特征做一定的排序展示,那么要求查詢用戶特征表的查詢性能非常高
3.推薦系統(tǒng):根據(jù)用戶最近瀏覽的數(shù)據(jù)做分析之后,推薦相關(guān)資源給用戶
4.點贊系統(tǒng):點贊計數(shù)系統(tǒng)
實時數(shù)據(jù)分析場景
GaussDB(for Cassandra)群組今天新來了一個成員,或者yutou今天發(fā)布一篇新文章,華為云數(shù)據(jù)庫官方自動向該用戶發(fā)出歡迎郵件。
昵稱為yutou的同學(xué)今天發(fā)布了一組新照片,那么另外一個程序自動向yutou的好友發(fā)送通知。
原生不具備的數(shù)據(jù)變更捕獲能力,GaussDB(for Cassandra)具有變更捕獲能力,能對數(shù)據(jù)的變更做實時在線分析,提供秒級的實時推送動作做出相應(yīng)處理;具有完善的離線分析解決方案,可以將離線分析時效縮短到60%,為商家爭取更多的時間做出相應(yīng)決策。
購買建議
GaussDB(for Cassandra)性能為開源2倍以上,存儲空間僅需開源自建1/3,幫助客戶節(jié)省成本,舉例如下:開源自建8u32g * 3節(jié)點 數(shù)據(jù)量:90G(三副本),購買GaussDB(for Cassandra)可選擇創(chuàng)建4u16g * 3節(jié)點 數(shù)據(jù)量:30G(DFV存儲三副本)。
審核編輯 黃昊宇
-
華為云
+關(guān)注
關(guān)注
3文章
2491瀏覽量
17430
發(fā)布評論請先 登錄
相關(guān)推薦
評論