數(shù)據(jù)可視化就是將抽象的“數(shù)據(jù)”以可見(jiàn)的形式表現(xiàn)出來(lái),幫助人理解數(shù)據(jù)。大數(shù)據(jù)可視化相對(duì)傳統(tǒng)的數(shù)據(jù)可視化,處理的數(shù)據(jù)對(duì)象有了本質(zhì)不同,在已有的小規(guī)?;蜻m度規(guī)模的結(jié)構(gòu)化數(shù)據(jù)基礎(chǔ)上,大數(shù)據(jù)可視化需要有效處理大規(guī)模、多類(lèi)型、快速更新類(lèi)型的數(shù)據(jù)。這給數(shù)據(jù)可視化研究與應(yīng)用帶來(lái)一系列新的挑戰(zhàn)。
數(shù)據(jù)可視化這一概念自1987年正式提出,經(jīng)過(guò)30余年的發(fā)展,逐漸形成3個(gè)分支:科學(xué)計(jì)算可視化(scientific visualization)、信息可視化(information visualization)和可視分析(visual analytics)。近些年來(lái),這3個(gè)子領(lǐng)域出現(xiàn)了逐漸融合的趨勢(shì)。本文統(tǒng)稱(chēng)為“數(shù)據(jù)可視化”。
在傳統(tǒng)數(shù)據(jù)可視化基礎(chǔ)上,論文嘗試給出大數(shù)據(jù)可視化的內(nèi)涵:大數(shù)據(jù)可視化是指有效處理大規(guī)模、多類(lèi)型和快速變化數(shù)據(jù)的圖形化交互式探索與顯示技術(shù)。
其中,有效是指在合理時(shí)間和空間開(kāi)銷(xiāo)范圍內(nèi);大規(guī)模、多類(lèi)型和快速變化是所處理數(shù)據(jù)的主要特點(diǎn);圖形化交互式探索是指支持通過(guò)圖形化的手段交互式分析數(shù)據(jù);顯示技術(shù)是指對(duì)數(shù)據(jù)的直觀展示。
大數(shù)據(jù)可視化技術(shù)
首先從方法層面介紹基本滿(mǎn)足常用數(shù)據(jù)可視化需求的通用技術(shù),根據(jù)可視化目標(biāo)分類(lèi)介紹,然后根據(jù)大數(shù)據(jù)的特點(diǎn),重點(diǎn)介紹相關(guān)的大規(guī)模數(shù)據(jù)可視化、時(shí)序數(shù)據(jù)可視化、面向可視化的數(shù)據(jù)采樣方法和數(shù)據(jù)可視化生成技術(shù)。
常用的數(shù)據(jù)可視化技術(shù)
數(shù)據(jù)可視化技術(shù)在應(yīng)用過(guò)程中,多數(shù)非技術(shù)驅(qū)動(dòng),而是目標(biāo)驅(qū)動(dòng)。如圖顯示了目前業(yè)界廣泛使用的根據(jù)目標(biāo)分類(lèi)的數(shù)據(jù)可視化方法,數(shù)據(jù)可視化目標(biāo)抽象為對(duì)比、分布、組成以及關(guān)系。
按目標(biāo)分類(lèi)的常用數(shù)據(jù)可視化方法
1、對(duì)比。比較不同元素之間或不同時(shí)刻之間的值。
2、分布。查看數(shù)據(jù)分布特征,是數(shù)據(jù)可視化最為常用的場(chǎng)景之一。
3、組成。查看數(shù)據(jù)靜態(tài)或動(dòng)態(tài)組成。
4、關(guān)系。查看變量之間的相關(guān)性,這常常用于結(jié)合統(tǒng)計(jì)學(xué)相關(guān)性分析方法,通過(guò)視覺(jué)結(jié)合使用者專(zhuān)業(yè)知識(shí)與場(chǎng)景需求判斷多個(gè)因素之間的影響關(guān)系。
大規(guī)模數(shù)據(jù)可視化一般認(rèn)為是處理數(shù)據(jù)規(guī)模達(dá)到TB或PB級(jí)別的數(shù)據(jù)。經(jīng)過(guò)數(shù)十年的發(fā)展,大規(guī)模數(shù)據(jù)可視化經(jīng)過(guò)了大量研究,重點(diǎn)介紹其中的并行可視化和原位(in situ)可視化。
(1)并行可視化
并行可視化通常包括3種并行處理模式,分別是任務(wù)并行、流水線并行、數(shù)據(jù)并行。
任務(wù)并行將可視化過(guò)程分為獨(dú)立的子任務(wù),同時(shí)運(yùn)行的子任務(wù)之間不存在數(shù)據(jù)依賴(lài)。
流水線并行采用流式讀取數(shù)據(jù)片段,將可視化過(guò)程分為多個(gè)階段,計(jì)算機(jī)并行執(zhí)行各個(gè)階段加速處理過(guò)程。
數(shù)據(jù)并行是一種“單程序多數(shù)據(jù)”方式,將數(shù)據(jù)劃分為多個(gè)子集,然后以子集為粒度并行執(zhí)行程序處理不同的數(shù)據(jù)子集。
(2)原位可視化
數(shù)值模擬過(guò)程中生成可視化,用于緩解大規(guī)模數(shù)值模擬輸出瓶頸。根據(jù)輸出不同,原位可視化分為圖像、分布、壓縮與特征。
輸出為圖像的原位可視化,在數(shù)值模擬過(guò)程中,將數(shù)據(jù)映射為可視化,并保存為圖像。
輸出為分布數(shù)據(jù)的原位可視化,根據(jù)使用者定義的統(tǒng)計(jì)指標(biāo),在數(shù)值模擬過(guò)程中計(jì)算統(tǒng)計(jì)指標(biāo)并保存,后續(xù)進(jìn)行統(tǒng)計(jì)數(shù)據(jù)可視化;
輸出為壓縮數(shù)據(jù)的原位可視化采用壓縮算法降低數(shù)值模擬數(shù)據(jù)輸出規(guī)模,將壓縮數(shù)據(jù)作為后續(xù)可視化處理的輸入;
輸出為特征的原位可視化采用特征提取方法,在數(shù)值模擬過(guò)程中提取特征并保存,將特征數(shù)據(jù)作為后續(xù)可視化處理的輸入。
(3)時(shí)序數(shù)據(jù)可視化
時(shí)序數(shù)據(jù)可視化是幫助人類(lèi)通過(guò)數(shù)據(jù)的視角觀察過(guò)去,預(yù)測(cè)未來(lái),例如建立預(yù)測(cè)模型,進(jìn)行預(yù)測(cè)性分析和用戶(hù)行為分析。
面積圖可顯示某時(shí)間段內(nèi)量化數(shù)值的變化和發(fā)展,最常用來(lái)顯示趨勢(shì)。氣泡圖可以將其中一條軸的變量設(shè)置為時(shí)間,或者把數(shù)據(jù)變量隨時(shí)間的變化制成動(dòng)畫(huà)來(lái)顯示。蠟燭圖通常用作交易工具。
甘特圖通常用作項(xiàng)目管理的組織工具,熱圖通過(guò)色彩變化來(lái)顯示數(shù)據(jù),直方圖適合用來(lái)顯示在連續(xù)間隔或特定時(shí)間段內(nèi)的數(shù)據(jù)分布。
折線圖用于在連續(xù)間隔或時(shí)間跨度上顯示定量數(shù)值,最常用來(lái)顯示趨勢(shì)和關(guān)系。南丁格爾玫瑰圖繪制于極坐標(biāo)系之上,適用于周期性時(shí)序數(shù)據(jù)。OHLC圖通常用作交易工具。
螺旋圖沿阿基米德螺旋線繪制基于時(shí)間的數(shù)據(jù)。堆疊式面積圖的原理與簡(jiǎn)單面積圖相同,但它能同時(shí)顯示多個(gè)數(shù)據(jù)系列。量化波形圖可顯示不同類(lèi)別的數(shù)據(jù)隨著時(shí)間的變化。
另外,具有空間位置信息的時(shí)序數(shù)據(jù),常常將上述可視化方法地圖結(jié)合,例如軌跡圖。
常用的數(shù)據(jù)可視化技術(shù)和方法有哪些。中琛魔方大數(shù)據(jù)平臺(tái)表示在大數(shù)據(jù)時(shí)代背景下,為了讓大眾更方便地享受數(shù)據(jù)結(jié)果,數(shù)據(jù)可視化技術(shù)應(yīng)運(yùn)而生。傳統(tǒng)的可視化技術(shù)基于計(jì)算機(jī)圖形的繪制,在傳統(tǒng)的可視化技術(shù)的基礎(chǔ)上,隨著計(jì)算機(jī)技術(shù)的發(fā)展以及數(shù)據(jù)圖象處理技術(shù)和其他主流智能技術(shù)的發(fā)展,現(xiàn)代可視化技術(shù)取得了一定的發(fā)展成果。
責(zé)任編輯:gt
-
可視化
+關(guān)注
關(guān)注
1文章
1194瀏覽量
20945 -
大數(shù)據(jù)
+關(guān)注
關(guān)注
64文章
8890瀏覽量
137449
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論