CeresDB 是一款高性能、分布式的云原生時序數(shù)據(jù)庫，采用 Rust 編寫。其開發(fā)團(tuán)隊近日宣布：經(jīng)過近一年的開源研發(fā)工作，時序數(shù)據(jù)庫 CeresDB 1.0 正式發(fā)布，達(dá)到生產(chǎn)可用標(biāo)準(zhǔn)。

CeresDB 1.0 官方中文文檔：https://docs.ceresdb.io/cn/

CeresDB 1.0 核心特性介紹

存儲引擎

支持列式混合存儲
高效 XOR 過濾器

云原生分布式

實(shí)現(xiàn)了計算存儲分離（支持 OSS 作為數(shù)據(jù)存儲，WAL 實(shí)現(xiàn)支持 OBKV、Kafka）
支持 HASH 分區(qū)表

部署與運(yùn)維

支持單機(jī)部署
支持分布式集群部署
支持 Prometheus + Grafana 搭建自監(jiān)控

讀寫協(xié)議

支持 SQL 查詢與寫入
實(shí)現(xiàn)了 CeresDB 內(nèi)置高性能讀寫協(xié)議，提供多語言 SDK
支持 Prometheus，可以作為 Prometheus 的 remote storage 進(jìn)行使用

多語言讀寫 SDK

實(shí)現(xiàn)了四種語言的客戶端 SDK：Java、Python、Go、Rust

CeresDB 架構(gòu)介紹

CeresDB 是一個時序數(shù)據(jù)庫，與經(jīng)典時序數(shù)據(jù)庫相比，CeresDB 的目標(biāo)是能夠同時處理時序型和分析型兩種模式的數(shù)據(jù)，并提供高效的讀寫。在經(jīng)典的時序數(shù)據(jù)庫中，Tag列（InfluxDB稱之為Tag，Prometheus稱之為Label）通常會對其生成倒排索引，但在實(shí)際使用中，Tag的基數(shù)在不同的場景中是不一樣的 ———— 在某些場景下，Tag的基數(shù)非常高（這種場景下的數(shù)據(jù)，我們稱之為分析型數(shù)據(jù)），而基于倒排索引的讀寫要為此付出很高的代價。而另一方面，分析型數(shù)據(jù)庫常用的掃描 + 剪枝方法，可以比較高效地處理這樣的分析型數(shù)據(jù)。因此 CeresDB 的基本設(shè)計理念是采用混合存儲格式和相應(yīng)的查詢方法，從而達(dá)到能夠同時高效處理時序型數(shù)據(jù)和分析型數(shù)據(jù)。下圖展示了 CeresDB 單機(jī)版本的架構(gòu)

┌──────────────────────────────────────────┐
│       RPC Layer (HTTP/gRPC/MySQL)        │
└──────────────────────────────────────────┘
┌──────────────────────────────────────────┐
│                 SQL Layer                │
│ ┌─────────────────┐  ┌─────────────────┐ │
│ │     Parser      │  │     Planner     │ │
│ └─────────────────┘  └─────────────────┘ │
└──────────────────────────────────────────┘
┌───────────────────┐  ┌───────────────────┐
│    Interpreter    │  │      Catalog      │
└───────────────────┘  └───────────────────┘
┌──────────────────────────────────────────┐
│               Query Engine               │
│ ┌─────────────────┐  ┌─────────────────┐ │
│ │    Optimizer    │  │    Executor     │ │
│ └─────────────────┘  └─────────────────┘ │
└──────────────────────────────────────────┘
┌──────────────────────────────────────────┐
│         Pluggable Table Engine           │
│  ┌────────────────────────────────────┐  │
│  │              Analytic              │  │
│  │┌────────────────┐┌────────────────┐│  │
│  ││      Wal       ││    Memtable    ││  │
│  │└────────────────┘└────────────────┘│  │
│  │┌────────────────┐┌────────────────┐│  │
│  ││     Flush      ││   Compaction   ││  │
│  │└────────────────┘└────────────────┘│  │
│  │┌────────────────┐┌────────────────┐│  │
│  ││    Manifest    ││  Object Store  ││  │
│  │└────────────────┘└────────────────┘│  │
│  └────────────────────────────────────┘  │
│  ┌ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─   │
│           Another Table Engine        │  │
│  └ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─   │
└──────────────────────────────────────────┘

性能優(yōu)化與實(shí)驗(yàn)結(jié)果

CeresDB 組合使用了列式混合存儲、數(shù)據(jù)分區(qū)、剪枝、高效掃描等技術(shù)，解決海量時間線（high cardinality）下寫入查詢性能變差的問題。

寫入優(yōu)化

CeresDB 采用類 LSM（Log-structured merge-tree）寫入模型，無需在寫入時處理復(fù)雜的倒排索引，因此寫入性能上較好。

查詢優(yōu)化

主要采用以下技術(shù)手段提高查詢性能：

剪枝：

min/max 剪枝：構(gòu)建代價比較低，在特定場景，性能較好
XOR 過濾器：提高對 parquet 文件中的 row group 的篩選精度

高效掃描：

多個 SST 間并發(fā)：同時掃描多個 SST 文件
單個 SST 內(nèi)部并發(fā)：支持 Parquet 層并行拉取多個 row group
合并小 IO：針對 OSS 上的文件，合并小 IO 請求，提高拉取效率
本地 cache：緩存 OSS 拉取文件，支持內(nèi)存和磁盤緩存

性能測試結(jié)果

采用 TSBS 進(jìn)行性能測試。壓測參數(shù)如下：

10 個 Tag
10 個 Field
時間線（Tags 組合數(shù)）100w 量級

壓測機(jī)器配置：24c90g

InfluxDB 版本：1.8.5

CeresDB 版本：1.0.0

寫入性能對比

InfluxDB 寫入性能隨著時間下降較多。CeresDB 在寫入穩(wěn)定后，寫入速率趨于平穩(wěn)，并且總體寫入性能表現(xiàn)為 InfluxDB 的 1.5 倍以上（一段時間后可達(dá) 2 倍以上差距）

下圖中，單行 row 包含 10 個 Field。

上圖為 Influxdb，下圖為 CeresDB

查詢性能對比

低篩選度條件（條件：os=Ubuntu15.10），CeresDB 比 InfluxDB 快 26 倍，具體數(shù)據(jù)如下：

CeresDB 查詢耗時：15s
InfluxDB 查詢耗時：6m43s

高篩選度條件（命中的數(shù)據(jù)較少，條件：hostname=[8 個]，此時理論上傳統(tǒng)倒排索引會更有效），這是 InfluxDB 更有優(yōu)勢的場景，此時在預(yù)熱完成條件下，CeresDB 比 InfluxDB 慢 5 倍。

CeresDB：85ms
InfluxDB：15ms

2023 年 roadmap

開發(fā)團(tuán)隊表示，2023 年，在 CeresDB 1.0 發(fā)布之后，他們大部分工作將聚焦在性能、分布式與周邊生態(tài)方面的工作。尤其周邊生態(tài)的對接支持工作，希望能讓各種不同的用戶更加簡單的用上 CeresDB：

周邊生態(tài)

生態(tài)兼容，包括 PromQL、InfluxdbQL、OpenTSDB 等常用時序數(shù)據(jù)庫協(xié)議兼容
運(yùn)維工具支持，包括 k8s 支持、CeresDB 運(yùn)維系統(tǒng)、自監(jiān)控等
開發(fā)者工具，包括數(shù)據(jù)導(dǎo)入導(dǎo)出等

性能

探索新的存儲格式
增強(qiáng)不同類型索引，強(qiáng)化 CeresDB 在不同工作負(fù)載下的表現(xiàn)

分布式

自動負(fù)載均衡
提高可用性、可靠性

審核編輯：李倩

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

數(shù)據(jù)存儲

數(shù)據(jù)存儲

+關(guān)注

關(guān)注
5

文章
977

瀏覽量
50953
數(shù)據(jù)庫

數(shù)據(jù)庫

+關(guān)注

關(guān)注
7

文章
3817

瀏覽量
64496
Rust

Rust

+關(guān)注

關(guān)注
1

文章
229

瀏覽量
6619

原文標(biāo)題：CeresDB 1.0正式發(fā)布，Rust高性能云原生時序數(shù)據(jù)庫

文章出處：【微信號：OSC開源社區(qū)，微信公眾號：OSC開源社區(qū)】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

云原生LLMOps平臺作用

云原生LLMOps平臺是一種基于云計算基礎(chǔ)設(shè)施和開發(fā)工具，專門用于構(gòu)建、部署和管理大型語言模型（LLM）全生命周期的平臺。以下，是對云原生LLMOps平臺作用的梳理，由AI部落小編整理。

發(fā)表于 01-06 10:21 ?30次閱讀

鴻蒙原生頁面高性能解決方案上線OpenHarmony社區(qū) 助力打造高性能原生應(yīng)用

NEXT的原生頁面高性能解決方案，從頁面滑動、跳轉(zhuǎn)及應(yīng)用冷啟動等關(guān)鍵環(huán)節(jié)，為開發(fā)者提供全面的支持。目前，這些解決方案均已上線OpenHarmony開源社區(qū)，可在OpenHarmony三方庫中心倉進(jìn)行搜索，歡迎開發(fā)者多多使用和共

發(fā)表于 01-02 18:00

時序數(shù)據(jù)庫TDengine 2024年保持高增長，實(shí)現(xiàn)收入翻倍

近日，時序數(shù)據(jù)庫 (Time Series Database) TDengine 正式公布了 2024 年重大成就和發(fā)展成績盤點(diǎn)。在這一年中，TDengine 以持續(xù)創(chuàng)新的技術(shù)能力、迅猛增長的市場

發(fā)表于 01-02 13:50 ?114次閱讀

<b class='flag-5'>時序數(shù)據(jù)庫</b>TDengine 2024年保持高增長，實(shí)現(xiàn)收入翻倍

艾體寶與Kubernetes原生數(shù)據(jù)平臺AppsCode達(dá)成合作

虹科姐妹公司艾體寶宣布與Kubernetes 原生數(shù)據(jù)平臺 AppsCode達(dá)成正式合作，致力于將其核心產(chǎn)品KubeDB引入中國市場，為企業(yè)提供專業(yè)、高效的云原生數(shù)據(jù)庫管理解決方案。

發(fā)表于 12-16 15:07 ?255次閱讀

什么是云原生MLOps平臺

云原生MLOps平臺，是指利用云計算的基礎(chǔ)設(shè)施和開發(fā)工具，來構(gòu)建、部署和管理機(jī)器學(xué)習(xí)模型的全生命周期的平臺。以下，是對云原生MLOps平臺的介紹，由AI部落小編整理。

發(fā)表于 12-12 13:13 ?119次閱讀

AI時代的數(shù)據(jù)庫技術(shù)發(fā)展論壇亮點(diǎn)前瞻

可以看到，數(shù)據(jù)庫技術(shù)作為數(shù)字經(jīng)濟(jì)的基石，在全球范圍內(nèi)正經(jīng)歷著由傳統(tǒng)架構(gòu)向云原生、智能化的轉(zhuǎn)型。而AI技術(shù)的融入，使得數(shù)據(jù)庫系統(tǒng)在性能優(yōu)化、自動化管理、智能決策等方面展現(xiàn)出前所未有的潛力

發(fā)表于 12-12 11:31 ?260次閱讀

軟通動力榮登2024云原生企業(yè)TOP50榜單

近日，DBC德本咨詢發(fā)布“2024云原生企業(yè)TOP50”榜單，軟通動力憑借自研的“天鶴云原生數(shù)據(jù)庫平臺” 榮登該榜單第8名，彰顯了公司在該領(lǐng)域的行業(yè)競爭力。

發(fā)表于 12-04 11:27 ?247次閱讀

云原生和數(shù)據(jù)庫哪個好一些？

云原生和數(shù)據(jù)庫哪個好一些？云原生和數(shù)據(jù)庫各有其獨(dú)特的優(yōu)勢，適用于不同的場景。云原生強(qiáng)調(diào)高效資源利用、快速開發(fā)部署和高可伸縮性，適合需要高度靈

發(fā)表于 11-29 10:07 ?160次閱讀

云原生和非云原生哪個好？六大區(qū)別詳細(xì)對比

云原生和非云原生各有優(yōu)劣，具體選擇取決于應(yīng)用場景。云原生利用云計算的優(yōu)勢，通過微服務(wù)、容器化和自動化運(yùn)維等技術(shù)，提高了應(yīng)用的可擴(kuò)展性、更新速度和成本效益。非云原生則可能更適合對延遲敏感

發(fā)表于 09-13 09:53 ?416次閱讀

利用NVIDIA RAPIDS加速DolphinDB Shark平臺提升計算性能

DolphinDB 是一家高性能數(shù)據(jù)庫研發(fā)企業(yè)，也是 NVIDIA 初創(chuàng)加速計劃成員，其開發(fā)的產(chǎn)品基于高性能分布式時序數(shù)據(jù)庫，是支持復(fù)雜計算和流數(shù)據(jù)

發(fā)表于 09-09 09:57 ?478次閱讀

京東云原生安全產(chǎn)品重磅發(fā)布

“安全產(chǎn)品那么多，我怎么知道防住了？”“大家都說自己是云原生的，我看都是換湯不換藥”在與客戶溝通云原生安全方案的時候，經(jīng)常會遇到這樣的吐槽。越來越的客戶已經(jīng)開始了云原生化的技術(shù)架構(gòu)改造，也意識到

發(fā)表于 07-26 10:36 ?495次閱讀

基于DPU與SmartNic的云原生SDN解決方案

隨著云計算，大數(shù)據(jù)和人工智能等技術(shù)的蓬勃發(fā)展，數(shù)據(jù)中心面臨著前所未有的數(shù)據(jù)洪流和計算壓力，這對SDN提出了更高的性能和效率要求。自云原生概念

發(fā)表于 07-22 11:44 ?716次閱讀

時序數(shù)據(jù)庫是什么？時序數(shù)據(jù)庫的特點(diǎn)

時序數(shù)據(jù)庫是一種在處理時間序列數(shù)據(jù)方面具有高效和專門化能力的數(shù)據(jù)庫。它主要用于存儲和處理時間序列數(shù)據(jù)，比如傳感器數(shù)據(jù)、監(jiān)控

發(fā)表于 04-26 16:02 ?671次閱讀

華為云多模數(shù)據(jù)庫 GeminiDB 架構(gòu)與應(yīng)用實(shí)踐直播問答實(shí)錄

多模數(shù)據(jù)庫作為一種新興的數(shù)據(jù)管理解決方案，正在受到越來越多的關(guān)注。而華為云多模數(shù)據(jù)庫 GeminiDB 基于云原生數(shù)據(jù)庫優(yōu)勢，讓企業(yè)應(yīng)用更智

發(fā)表于 04-08 18:25 ?1176次閱讀

華為云原生多模數(shù)據(jù)庫 GeminiDB 架構(gòu)與應(yīng)用實(shí)踐

近日，2023 全球分布式云大會·深圳站順利召開，華為云 NoSQL 數(shù)據(jù)庫研發(fā)總監(jiān)余汶龍在會上發(fā)表了題為《華為云原生多模數(shù)據(jù)庫 GeminiDB 架構(gòu)與應(yīng)用實(shí)踐》的精彩演講。余汶龍?zhí)岢鲈谥悄?/div>
發(fā)表于 04-08 18:23 ?1187次閱讀

搜索歷史

CeresDB 1.0正式發(fā)布，Rust高性能云原生時序數(shù)據(jù)庫