0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

ClickHouse:強大的數(shù)據(jù)分析引擎

京東云 ? 來源:京東物流 陳昌浩 ? 作者:京東物流 陳昌浩 ? 2024-12-10 10:23 ? 次閱讀

作者:京東物流 陳昌浩

最近的工作中接觸到CK,一開始還不知道CK是什么,通過查詢才知道CK是ClickHouse,ClickHouse 是俄羅斯的Yandex于2016年開源的列式存儲數(shù)據(jù)庫,是一款開源的面向列的分布式數(shù)據(jù)庫管理系統(tǒng),以其卓越的性能和強大的數(shù)據(jù)分析能力在大數(shù)據(jù)領(lǐng)域備受矚目。

列式存儲

列式存儲是一種數(shù)據(jù)存儲結(jié)構(gòu),也稱為列存儲或列式數(shù)據(jù)庫。它將數(shù)據(jù)按列存儲而非傳統(tǒng)的按行存儲。每一列的數(shù)據(jù)類型相同或者相似。

例如表結(jié)果如下:

姓名 成績 排名
李磊 146 1
趙剛 130 2
王淼 90 3

采用行式存儲時,數(shù)據(jù)在磁盤上的組織結(jié)構(gòu)為:

wKgZO2dXpiiADw9EAACgk7YTi4Q286.png

采用列式存儲時,數(shù)據(jù)在磁盤上的組織結(jié)構(gòu)為:

wKgZPGdXpimACeNyAACsZL4D4pc855.png

列存儲在寫入效率、保證數(shù)據(jù)完整性上都不如行存儲,它的優(yōu)勢是在讀取過程,不會產(chǎn)生冗余數(shù)據(jù),這對數(shù)據(jù)完整性要求不高的大數(shù)據(jù)處理領(lǐng)域,比如互聯(lián)網(wǎng),猶為重要。

ClickHouse 的主要特點

高性能

?快速的查詢響應(yīng):能夠在秒級甚至亞秒級時間內(nèi)處理大規(guī)模數(shù)據(jù)的查詢請求。

?高效的數(shù)據(jù)壓縮:采用了多種數(shù)據(jù)壓縮算法,大大減少了數(shù)據(jù)存儲占用的空間,同時提高了數(shù)據(jù)讀取的速度。

? 向量化執(zhí)行引擎:可以并行處理大量數(shù)據(jù),充分利用現(xiàn)代硬件的優(yōu)勢,提高執(zhí)行效率。

可擴展性

?分布式架構(gòu):支持水平擴展,可以輕松地添加更多的服務(wù)器節(jié)點來處理不斷增長的數(shù)據(jù)量和查詢負載。

?數(shù)據(jù)分片:將數(shù)據(jù)分散存儲在不同的節(jié)點上,提高數(shù)據(jù)的可用性和可靠性。

豐富的數(shù)據(jù)分析功能

?支持多種數(shù)據(jù)類型:包括數(shù)值、字符串、日期時間等常見數(shù)據(jù)類型,以及數(shù)組、嵌套結(jié)構(gòu)等復(fù)雜數(shù)據(jù)類型。

?強大的聚合函數(shù):提供了豐富的聚合函數(shù),如求和、平均值、最大值、最小值等,方便進行數(shù)據(jù)分析和統(tǒng)計。

?支持 SQL 語言:用戶可以使用熟悉的 SQL 語句進行數(shù)據(jù)查詢和分析,降低了學(xué)習(xí)成本。

場景支持

ClickHouse的數(shù)據(jù)處理速度非???,尤其適合于包含復(fù)雜分析查詢的場景

適合場景

?日志和事件數(shù)據(jù):由于ClickHouse的處理速度,它可以作為實時數(shù)據(jù)分析的工具。

?監(jiān)控和報警系統(tǒng):ClickHouse可以用于快速查詢和顯示監(jiān)控數(shù)據(jù)。

?交互式查詢:由于其快速的查詢速度,ClickHouse可以作為數(shù)據(jù)科學(xué)家進行交互式探索的工具。

?數(shù)據(jù)倉庫:ClickHouse可以作為數(shù)據(jù)倉庫的一種替代方法,用于快速查詢和分析。

不適合場景

?事務(wù)處理:ClickHouse不支持事務(wù)處理。

?強一致性:ClickHouse不保證數(shù)據(jù)的強一致性。

?低延遲的更新:ClickHouse不適合于需要實時或近實時更新數(shù)據(jù)的場景。

?高度模式化的數(shù)據(jù):ClickHouse對模式的靈活性不如關(guān)系型數(shù)據(jù)庫。

小結(jié)

總之,ClickHouse 是一款功能強大的數(shù)據(jù)庫管理系統(tǒng),適用于大規(guī)模數(shù)據(jù)分析和處理場景。通過了解其特點和基礎(chǔ)知識,用戶可以更好地利用 ClickHouse 來滿足自己的數(shù)據(jù)分析需求

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
收藏 人收藏

    評論

    相關(guān)推薦

    數(shù)據(jù)分析

    數(shù)據(jù)分析軟件
    發(fā)表于 05-28 22:31

    數(shù)據(jù)分析需要的技能

    商業(yè)價值的轉(zhuǎn)換,數(shù)據(jù)分析師是其中一個重要的職位,那么,想從事該職業(yè)需要具備哪些技能呢?1. 精通ExcelExcel處理技能是大數(shù)據(jù)分析師必備技能,并且需要十分精通,除了常規(guī)操作和函數(shù),一些不常
    發(fā)表于 04-10 15:59

    python數(shù)據(jù)分析的類庫

    ,因為它太重要了.Pandas庫提供了我們很多函數(shù),能夠快速的方便的,處理結(jié)構(gòu)化的大型數(shù)據(jù),不夸張的說,Pandas是讓Python成為強大數(shù)據(jù)分析工具的非常重要的一個因素。而且對于金融行業(yè),比如基金
    發(fā)表于 05-10 15:18

    怎么有效學(xué)習(xí)Python數(shù)據(jù)分析?

    Python在人工智能、機器學(xué)習(xí)領(lǐng)域受到火熱追捧,很大程度上在于它擁有非常龐大的第三方庫,以及強大的通用編程性能。因此,快速掌握Python進行數(shù)據(jù)分析,就是學(xué)習(xí)Python各種第三方庫、工具包
    發(fā)表于 06-28 15:18

    數(shù)據(jù)實時分析領(lǐng)域的ClickHouse

    ClickHouse數(shù)據(jù)實時分析領(lǐng)域的黑馬
    發(fā)表于 03-24 11:09

    BI數(shù)據(jù)分析軟件使用指南

    BI數(shù)據(jù)分析軟件做數(shù)據(jù)深度分析又快又直觀,還能靈活滿足不同人的數(shù)據(jù)分析需求,因此選擇BI數(shù)據(jù)分析軟件的企業(yè)與個人也越來越多,但卻仍有很大一部
    發(fā)表于 01-04 11:00

    Centos7下如何搭建ClickHouse列式存儲數(shù)據(jù)

    一、ClickHouse簡介1、基礎(chǔ)簡介Yandex開源的數(shù)據(jù)分析數(shù)據(jù)庫,名字叫做ClickHouse,適合流式或批次入庫的時序數(shù)據(jù)。
    發(fā)表于 01-05 18:03

    什么樣的數(shù)據(jù)分析軟件能讓全員自助可視化分析更絲滑?

    數(shù)據(jù)分析軟件上,卻是截然不同的結(jié)果。軟件全面支持主流分布式大數(shù)據(jù)技術(shù),如Hadoop 、Clickhouse、GreenPlum等,與Starrocks、金倉數(shù)據(jù)庫管理系統(tǒng)Kingba
    發(fā)表于 09-22 10:04

    電商數(shù)據(jù)分析攻略,讓你輕松搞定數(shù)據(jù)分析!

    在當(dāng)今的數(shù)字經(jīng)濟時代,運用大數(shù)據(jù)分析來促進業(yè)務(wù)增長已然成為一種普遍行為,擁有一套系統(tǒng)化的數(shù)據(jù)分析方案尤為重要。奧威BI電商數(shù)據(jù)分析方案是一種基于數(shù)據(jù)挖掘和機器學(xué)習(xí)技術(shù)的解決方案,以豐富
    發(fā)表于 06-27 09:22

    PB級分析數(shù)據(jù)ClickHouse的應(yīng)用場景和特性等分享

    在百花齊放的交互式分析領(lǐng)域,ClickHouse 絕對是后起之秀,它雖然年輕,卻有非常大的發(fā)展空間。本文將分享 PB 級分析數(shù)據(jù)ClickHo
    的頭像 發(fā)表于 03-30 10:36 ?7574次閱讀
    PB級<b class='flag-5'>分析</b>型<b class='flag-5'>數(shù)據(jù)</b>庫<b class='flag-5'>ClickHouse</b>的應(yīng)用場景和特性等分享

    火山引擎ClickHouse增強計劃之“Upsert”

    性能下降嚴重,ReplacingMergeTree采用的是寫優(yōu)先的設(shè)計邏輯,這導(dǎo)致讀性能損失嚴重。表現(xiàn)是在進行查詢時性能較ClickHouse其他引擎的性能下降嚴重,涉及ReplacingMergeTree的查詢響應(yīng)時間過慢。
    的頭像 發(fā)表于 09-22 14:26 ?1741次閱讀

    替代ELK:ClickHouse+Kafka+FlieBeat才是最絕的

    用折中方案完善數(shù)據(jù)分析。 Elasticsearch 與 ClickHouse ClickHouse是一款系統(tǒng)列式對數(shù)據(jù)庫管理的測試,我們使用Cli
    的頭像 發(fā)表于 10-09 17:41 ?2058次閱讀

    火山引擎ClickHouse增強計劃之“多表關(guān)聯(lián)查詢”

    相信大家都對大名鼎鼎的ClickHouse有一定的了解了,它強大數(shù)據(jù)分析性能讓人印象深刻。但在字節(jié)大量生產(chǎn)使用中,發(fā)現(xiàn)了ClickHouse依然存在了一定的限制。例如: ? 缺少完整
    的頭像 發(fā)表于 10-10 17:00 ?1576次閱讀

    如何為ClickHouse增強高可用能力

    相信大家都對大名鼎鼎的ClickHouse有一定的了解了,它強大數(shù)據(jù)分析性能讓人印象深刻。但在字節(jié)大量生產(chǎn)使用中,發(fā)現(xiàn)了ClickHouse依然存在了一定的限制。例如:
    的頭像 發(fā)表于 10-31 15:00 ?1085次閱讀

    如何使用原生ClickHouse函數(shù)和表引擎在兩個數(shù)據(jù)庫之間遷移數(shù)據(jù)

    展示如何使用 Postgres 表引擎分析查詢的結(jié)果從 ClickHouse 推回 Postgres。當(dāng)用戶需要在終端用戶應(yīng)用程序中顯示匯總數(shù)據(jù),但又
    的頭像 發(fā)表于 05-26 11:38 ?782次閱讀
    如何使用原生<b class='flag-5'>ClickHouse</b>函數(shù)和表<b class='flag-5'>引擎</b>在兩個<b class='flag-5'>數(shù)據(jù)</b>庫之間遷移<b class='flag-5'>數(shù)據(jù)</b>