0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

分析型數(shù)據(jù)庫如何創(chuàng)新?GOTC 2023議題揭秘

焦點(diǎn)訊 ? 來源: 焦點(diǎn)訊 ? 作者: 焦點(diǎn)訊 ? 2023-05-19 09:03 ? 次閱讀

在群雄逐鹿的 OLAP 數(shù)據(jù)庫市場,開源引擎 ClickHouse 憑借其出色的性能成為公認(rèn)的黑馬。官方稱其性能超過了市場上同類的列式數(shù)據(jù)庫,每臺服務(wù)器每秒可處理數(shù)億到超過十億行、體積達(dá)數(shù)十 GB 的數(shù)據(jù),運(yùn)行速度比傳統(tǒng)數(shù)據(jù)庫快 100-1000 倍。

高效運(yùn)行速度的另一面,還隱含著成本、性能、容量等諸多問題,比如不支持事務(wù),不能夠保證數(shù)據(jù)的一致性和完整性,不存在隔離級別,不支持高并發(fā)等等。這導(dǎo)致 2016 年開源的 ClickHouse 難以應(yīng)對當(dāng)下更加復(fù)雜,數(shù)據(jù)規(guī)模更加巨大的場景需求。

比如在字節(jié)內(nèi)部,從 2018 年引入 ClickHouse,因為業(yè)務(wù)的發(fā)展,要服務(wù)于大量的用戶,數(shù)據(jù)規(guī)模變得越來越巨大。由于 ClickHouse 是 Shared-Nothing 的架構(gòu),每個節(jié)點(diǎn)是獨(dú)立的,不會共享存儲資源等,因而計算資源和存儲資源是緊耦合的。這導(dǎo)致擴(kuò)縮容成本變高,且會涉及到數(shù)據(jù)遷移,不能實時按需的擴(kuò)縮容,從而導(dǎo)致資源的浪費(fèi)。此外,ClickHouse 的緊耦合的架構(gòu)會導(dǎo)致多租戶在共享集群相互影響,另外由于讀寫在一個節(jié)點(diǎn)完成,導(dǎo)致讀寫受到影響,最后 ClickHouse 在復(fù)雜查詢上例如多表 join 等的性能支持并不是很好。

wKgaomRmyumAUnuzAACWX3YhWsA499.png

字節(jié) ClickHouse 使用情況

為了解決這些痛點(diǎn),字節(jié)在 ClickHouse 架構(gòu)基礎(chǔ)上進(jìn)行了升級,于 2020 年在內(nèi)部啟動了 ByConity 項目,并于 2023 年 1 月發(fā)布 Beta 版本,將于 5 月底正式對外開源。

ByConity 是一個開源的云原生數(shù)據(jù)倉庫,采用存儲 - 計算分離的架構(gòu)。它支持多個關(guān)鍵功能特性,如存儲計算分離、彈性擴(kuò)縮容、租戶資源隔離和數(shù)據(jù)讀寫的強(qiáng)一致性等。通過利用主流的 OLAP 引擎優(yōu)化,如列存儲、向量化執(zhí)行、MPP 執(zhí)行、查詢優(yōu)化等,ByConity 可以提供優(yōu)異的讀寫性能。

ByConity 的架構(gòu)分為三層,如下圖所示,服務(wù)接入層包含負(fù)責(zé)客戶端數(shù)據(jù)和服務(wù)的接入,也就是 ByConity Server;計算組為 ByConity 的計算資源層,每個 Virtual Warehouse 是一個計算組;數(shù)據(jù)存儲層由分布式文件系統(tǒng),如 HDFS、S3 等構(gòu)成。

wKgZomRmyumAXAVBAAE5eh2YHKM185.png

ByConity 三層技術(shù)架構(gòu)圖

除了兼?zhèn)?ClickHouse 的一些優(yōu)點(diǎn)外,ByConity 還實現(xiàn)了了諸多新的功能。

ByConity 的一個重要優(yōu)勢是存儲-計算分離的架構(gòu),它實現(xiàn)了讀寫分離和彈性擴(kuò)縮容。它的優(yōu)勢是高彈性和高擴(kuò)展性。這種架構(gòu)確保讀操作和寫操作不會相互影響,使得計算資源和存儲資源解耦,兩者可以按需的且獨(dú)立的擴(kuò)縮容,確保資源高效利用。此外,ByConity 支持多租戶資源隔離功能,保證不同租戶之間不會互相影響,使 ByConity 適用于多租戶環(huán)境,如圖 2。

wKgaomRmyuqAUWhAAAEexZn9H-s684.png

ByConity 存儲 - 計算分離,實現(xiàn)多租戶隔離

ByConity 支持彈性的擴(kuò)縮容,能夠?qū)崟r、按需的對計算資源進(jìn)行擴(kuò)縮容,保證資源的高效利用。并且它能對不同的租戶進(jìn)行資源的隔離,租戶之間不會受到相互影響。其另一個重要功能是數(shù)據(jù)讀寫的強(qiáng)一致性,確保數(shù)據(jù)始終是最新的,讀寫之間沒有不一致。此外,ByConity 采用了主流的 OLAP 引擎優(yōu)化,例如列存、向量化執(zhí)行、MPP 執(zhí)行、查詢優(yōu)化等,來保證提供了優(yōu)異的讀寫性能。

之所以采用開源的模式,ByConity 項目組是希望能夠把項目回饋給社區(qū),同時也希望通過社區(qū)的力量加強(qiáng)和完善 ByConity。接下來,ByConity 在 2023 開源社區(qū)發(fā)展規(guī)劃中,希望增強(qiáng) ByConity 的功能、性能和易用性,重點(diǎn)關(guān)注開發(fā)新的存儲引擎、支持更多的數(shù)據(jù)類型和與其他數(shù)據(jù)管理工具的集成領(lǐng)域。

5 月 28 日,字節(jié)跳動分析型數(shù)據(jù)庫負(fù)責(zé)人陳星將出席 GOTC 2023 “數(shù)據(jù)與數(shù)據(jù)庫技術(shù)” 分論壇,并擔(dān)任講師,帶來《ByConity: 分析型數(shù)據(jù)庫技術(shù)創(chuàng)新與開放之路》主題演講,詳解 ByConity 中的關(guān)鍵技術(shù)選擇,分享 ByConity 開源與開放背后的故事。

敬請期待!

全球開源技術(shù)峰會(Global Open-source Technology Conference),簡稱 GOTC,是由開放原子開源基金會、上海浦東軟件園、Linux 基金會亞太區(qū)和開源中國聯(lián)合發(fā)起的,面向全球開發(fā)者的一場盛大開源技術(shù)盛宴。

5 月 27 日至 28 日,GOTC 2023 將于上海舉辦為期 2 天的開源行業(yè)盛會。大會將以行業(yè)展覽、主題發(fā)言、專題論壇、開源市集的形式展現(xiàn),與會者將一起探討元宇宙、3D 與游戲、eBPF、Web3.0、區(qū)塊鏈等熱門技術(shù)主題,以及開源社區(qū)、AIGC、汽車軟件、AI 編程、開源教育培訓(xùn)、云原生等熱門話題,探討開源未來,助力開源發(fā)展。

GOTC 2023報名通道現(xiàn)已開啟,誠邀全球各技術(shù)領(lǐng)域開源愛好者共襄盛舉!

審核編輯黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 數(shù)據(jù)庫
    +關(guān)注

    關(guān)注

    7

    文章

    3817

    瀏覽量

    64484
收藏 人收藏

    評論

    相關(guān)推薦

    數(shù)據(jù)庫數(shù)據(jù)恢復(fù)—Mysql數(shù)據(jù)庫表記錄丟失的數(shù)據(jù)恢復(fù)流程

    Mysql數(shù)據(jù)庫故障: Mysql數(shù)據(jù)庫表記錄丟失。 Mysql數(shù)據(jù)庫故障表現(xiàn): 1、Mysql數(shù)據(jù)庫表中無任何數(shù)據(jù)或只有部分
    的頭像 發(fā)表于 12-16 11:05 ?173次閱讀
    <b class='flag-5'>數(shù)據(jù)庫</b><b class='flag-5'>數(shù)據(jù)</b>恢復(fù)—Mysql<b class='flag-5'>數(shù)據(jù)庫</b>表記錄丟失的<b class='flag-5'>數(shù)據(jù)</b>恢復(fù)流程

    數(shù)據(jù)庫數(shù)據(jù)恢復(fù)—MYSQL數(shù)據(jù)庫ibdata1文件損壞的數(shù)據(jù)恢復(fù)案例

    mysql數(shù)據(jù)庫故障: mysql數(shù)據(jù)庫文件ibdata1、MYI、MYD損壞。 故障表現(xiàn):1、數(shù)據(jù)庫無法進(jìn)行查詢等操作;2、使用mysqlcheck和myisamchk無法修復(fù)數(shù)據(jù)庫
    的頭像 發(fā)表于 12-09 11:05 ?173次閱讀

    數(shù)據(jù)庫數(shù)據(jù)恢復(fù)—通過拼接數(shù)據(jù)庫碎片恢復(fù)SQLserver數(shù)據(jù)庫

    一個運(yùn)行在存儲上的SQLServer數(shù)據(jù)庫,有1000多個文件,大小幾十TB。數(shù)據(jù)庫每10天生成一個NDF文件,每個NDF幾百GB大小。數(shù)據(jù)庫包含兩個LDF文件。 存儲損壞,數(shù)據(jù)庫
    的頭像 發(fā)表于 10-31 13:21 ?254次閱讀
    <b class='flag-5'>數(shù)據(jù)庫</b><b class='flag-5'>數(shù)據(jù)</b>恢復(fù)—通過拼接<b class='flag-5'>數(shù)據(jù)庫</b>碎片恢復(fù)SQLserver<b class='flag-5'>數(shù)據(jù)庫</b>

    數(shù)據(jù)庫可以租用嗎?完整租用流程來了

    數(shù)據(jù)庫是可以租用的,這是一種合法且便捷的數(shù)據(jù)存儲和管理方式。云數(shù)據(jù)庫是云服務(wù)提供商提供的各種服務(wù)化的關(guān)系數(shù)據(jù)庫(如RDS)、文檔
    的頭像 發(fā)表于 10-28 09:54 ?179次閱讀

    數(shù)據(jù)庫數(shù)據(jù)恢復(fù)—SQL Server數(shù)據(jù)庫出現(xiàn)823錯誤的數(shù)據(jù)恢復(fù)案例

    SQL Server數(shù)據(jù)庫故障: SQL Server附加數(shù)據(jù)庫出現(xiàn)錯誤823,附加數(shù)據(jù)庫失敗。數(shù)據(jù)庫沒有備份,無法通過備份恢復(fù)數(shù)據(jù)庫。
    的頭像 發(fā)表于 09-20 11:46 ?365次閱讀
    <b class='flag-5'>數(shù)據(jù)庫</b><b class='flag-5'>數(shù)據(jù)</b>恢復(fù)—SQL Server<b class='flag-5'>數(shù)據(jù)庫</b>出現(xiàn)823錯誤的<b class='flag-5'>數(shù)據(jù)</b>恢復(fù)案例

    恒訊科技分析:云數(shù)據(jù)庫rds和redis區(qū)別是什么如何選擇?

    數(shù)據(jù)庫RDS(Relational Database Service)和Redis是兩種不同類型的數(shù)據(jù)庫服務(wù),它們有各自的特點(diǎn)和適用場景: 1、數(shù)據(jù)模型:RDS是一種關(guān)系
    的頭像 發(fā)表于 08-19 15:31 ?410次閱讀

    恒訊科技分析:sql數(shù)據(jù)庫怎么用?

    SQL數(shù)據(jù)庫的使用通常包括以下幾個基本步驟: 1、選擇數(shù)據(jù)庫系統(tǒng): 選擇適合您需求的SQL數(shù)據(jù)庫系統(tǒng),如MySQL、PostgreSQL、Microsoft SQL Server、SQLite等
    的頭像 發(fā)表于 07-15 14:40 ?373次閱讀

    數(shù)據(jù)倉庫與數(shù)據(jù)庫的主要區(qū)別

    數(shù)據(jù)倉庫與數(shù)據(jù)庫是兩個在信息技術(shù)領(lǐng)域中常見的概念,它們在數(shù)據(jù)管理和分析方面發(fā)揮著重要作用。盡管它們在某些方面有相似之處,但它們在設(shè)計、目的和功能上存在顯著差異。本文將介紹
    的頭像 發(fā)表于 07-05 14:57 ?536次閱讀

    鴻蒙開發(fā)接口數(shù)據(jù)管理:【@ohos.data.rdb (關(guān)系數(shù)據(jù)庫)】

    關(guān)系數(shù)據(jù)庫(Relational Database,RDB)是一種基于關(guān)系模型來管理數(shù)據(jù)數(shù)據(jù)庫。關(guān)系
    的頭像 發(fā)表于 06-10 18:35 ?1338次閱讀

    HarmonyOS開發(fā)案例:【搭建關(guān)系數(shù)據(jù)庫】(4)

    本節(jié)將介紹如何調(diào)用關(guān)系數(shù)據(jù)庫接口在本地搭建數(shù)據(jù)庫,并讀寫相應(yīng)的用戶數(shù)據(jù)。
    的頭像 發(fā)表于 05-11 10:27 ?909次閱讀
    HarmonyOS開發(fā)案例:【搭建關(guān)系<b class='flag-5'>型</b><b class='flag-5'>數(shù)據(jù)庫</b>】(4)

    數(shù)據(jù)庫數(shù)據(jù)恢復(fù)—raid5陣列上層Sql Server數(shù)據(jù)庫數(shù)據(jù)恢復(fù)案例

    數(shù)據(jù)庫數(shù)據(jù)恢復(fù)環(huán)境: 5塊硬盤組建一組RAID5陣列,劃分LUN供windows系統(tǒng)服務(wù)器使用。windows系統(tǒng)服務(wù)器內(nèi)運(yùn)行了Sql Server數(shù)據(jù)庫,存儲空間在操作系統(tǒng)層面劃分了三個邏輯分區(qū)
    的頭像 發(fā)表于 05-08 11:43 ?523次閱讀
    <b class='flag-5'>數(shù)據(jù)庫</b><b class='flag-5'>數(shù)據(jù)</b>恢復(fù)—raid5陣列上層Sql Server<b class='flag-5'>數(shù)據(jù)庫</b><b class='flag-5'>數(shù)據(jù)</b>恢復(fù)案例

    HarmonyOS開發(fā)案例:【關(guān)系數(shù)據(jù)庫

    使用關(guān)系數(shù)據(jù)庫的相關(guān)接口實現(xiàn)了對賬單的增、刪、改、查操作。
    的頭像 發(fā)表于 04-22 14:58 ?663次閱讀
    HarmonyOS開發(fā)案例:【關(guān)系<b class='flag-5'>型</b><b class='flag-5'>數(shù)據(jù)庫</b>】

    選擇 KV 數(shù)據(jù)庫最重要的是什么?

    經(jīng)常有客戶提到 KV 數(shù)據(jù)庫,但卻偏偏“不要 Redis”。比如有個做安全威脅分析平臺的客戶,他們明確表示自己對可靠性要求非常高,需要的不是開源 Redis 這種內(nèi)存緩存,而是 KV 數(shù)據(jù)庫
    的頭像 發(fā)表于 03-28 22:11 ?707次閱讀
    選擇 KV <b class='flag-5'>數(shù)據(jù)庫</b>最重要的是什么?

    數(shù)據(jù)庫數(shù)據(jù)恢復(fù)】Oracle數(shù)據(jù)庫ASM實例無法掛載的數(shù)據(jù)恢復(fù)案例

    oracle數(shù)據(jù)庫ASM磁盤組掉線,ASM實例不能掛載。數(shù)據(jù)庫管理員嘗試修復(fù)數(shù)據(jù)庫,但是沒有成功。
    的頭像 發(fā)表于 02-01 17:39 ?533次閱讀
    【<b class='flag-5'>數(shù)據(jù)庫</b><b class='flag-5'>數(shù)據(jù)</b>恢復(fù)】Oracle<b class='flag-5'>數(shù)據(jù)庫</b>ASM實例無法掛載的<b class='flag-5'>數(shù)據(jù)</b>恢復(fù)案例

    深耕文檔數(shù)據(jù)庫12載,SequoiaDB再開源

    1月15日,巨杉數(shù)據(jù)庫舉行SequoiaDB新特性及開源項目發(fā)布活動。本次活動回顧了巨杉數(shù)據(jù)庫深耕JSON文檔數(shù)據(jù)庫12年的發(fā)展歷程與技術(shù)演進(jìn),全面解讀了SequoiaDB包括在高可
    的頭像 發(fā)表于 01-16 13:06 ?298次閱讀