0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

數(shù)據(jù)可視化,不僅僅是統(tǒng)計圖表

電子工程師 ? 來源:未知 ? 作者:李倩 ? 2018-10-23 09:56 ? 次閱讀

前言

數(shù)據(jù)可視化,是指將相對晦澀的的數(shù)據(jù)通過可視的、交互的方式進行展示,從而形象、直觀地表達數(shù)據(jù)蘊含的信息和規(guī)律。

早期的數(shù)據(jù)可視化作為咨詢機構(gòu)、金融企業(yè)的專業(yè)工具,其應(yīng)用領(lǐng)域較為單一,應(yīng)用形態(tài)較為保守。步入大數(shù)據(jù)時代,各行各業(yè)對數(shù)據(jù)的重視程度與日俱增,隨之而來的是對數(shù)據(jù)進行一站式整合、挖掘、分析、可視化的需求日益迫切,數(shù)據(jù)可視化呈現(xiàn)出愈加旺盛的生命力,表現(xiàn)之一就是視覺元素越來越多樣,從樸素的柱狀圖/餅狀圖/折線圖,擴展到地圖、氣泡圖、樹圖、儀表盤等各式圖形。表現(xiàn)之二是可用的開發(fā)工具越來越豐富,從專業(yè)的數(shù)據(jù)庫/財務(wù)軟件,擴展到基于各類編程語言的可視化庫,相應(yīng)的應(yīng)用門檻也越來越低。

數(shù)據(jù)可視化,不僅僅是統(tǒng)計圖表。本質(zhì)上,任何能夠借助于圖形的方式展示事物原理、規(guī)律、邏輯的方法都叫數(shù)據(jù)可視化。

數(shù)據(jù)可視化不僅是一門包含各種算法的技術(shù), 還是一個具有方法論的學(xué)科。一般而言,完整的可視化流程包括以下內(nèi)容:

可視化輸入:包括可視化任務(wù)的描述,數(shù)據(jù)的來源與用途,數(shù)據(jù)的基本屬性、概念模型等;

可視化處理:對輸入的數(shù)據(jù)進行各種算法加工,包括數(shù)據(jù)清洗、篩選、降維、聚類等操作,并將數(shù)據(jù)與視覺編碼進行映射;

可視化輸出:基于視覺原理和任務(wù)特性,選擇合理的生成工具和方法,生成可視化作品。

實際上,從“數(shù)據(jù)可視化”的命名,便很容易看出數(shù)據(jù)可視化從業(yè)者如何開始可視化設(shè)計,那便是:處理數(shù)據(jù),設(shè)計視覺,完成從數(shù)據(jù)空間到可視空間的映射, 必要時重復(fù)數(shù)據(jù)處理和圖形繪制的循環(huán)組合。

1. 分析數(shù)據(jù)

首先,我們需要對數(shù)據(jù)做一個全面而細致的解讀,數(shù)據(jù)的特點決定著可視化的設(shè)計原則。每項數(shù)據(jù)都有特定的屬性(或稱特征、維度)和對應(yīng)的值,一組屬性構(gòu)成特征列表。按照屬性的類型,數(shù)據(jù)可以分為數(shù)值型、有序型、類別型,數(shù)值型又可以進一步分為固定零點和非固定零點。其中,固定零點數(shù)據(jù)囊括了我們大多數(shù)的數(shù)據(jù)對象,它們都可以對應(yīng)到數(shù)軸上的某個點;非固定零點主要包括以數(shù)值表示的特定含義,如表示地理信息的經(jīng)緯度、表示日期的年月日等,在分析非固定零點數(shù)據(jù)時,我們更在意的是它們的區(qū)間。

在對數(shù)據(jù)做過預(yù)處理和分析之后,我們就能夠觀察出待處理數(shù)據(jù)的分布和維度,再結(jié)合業(yè)務(wù)邏輯和可視化目標(biāo),有可能還要對數(shù)據(jù)做某些變換,這些變換包括:

標(biāo)準(zhǔn)化,常用的手段包括(0,1)標(biāo)準(zhǔn)化或(-1,1)標(biāo)準(zhǔn)化,分別對應(yīng)的是sigmoid函數(shù)和tanh函數(shù),這么做的目的在于使數(shù)據(jù)合法和美觀,但在這一過程中可能丟失影響數(shù)據(jù)分布、維度、趨勢的信息,應(yīng)該予以特別注意;

擬合/平滑,為表現(xiàn)數(shù)據(jù)變化趨勢,使受眾對數(shù)據(jù)發(fā)展有所預(yù)測,我們會引入回歸來對數(shù)據(jù)進行擬合,以達到減少噪音,凸顯數(shù)據(jù)趨勢的目的;

采樣,有些情況下,數(shù)據(jù)點過多,以至于不易可視化或者影響視覺體驗,我們會使用隨機采樣的方法抽取部分數(shù)據(jù)點,抽樣結(jié)果與全集近似分布,同時不影響可視化元素的對比或趨勢;

降維,一般而言,同一可視化圖表中能夠承載的維度有限(很難超過3個維度),必須對整個數(shù)據(jù)集進行降維處理。

2. 可視化設(shè)計

在開始設(shè)計之前,我們需要對人類視覺以及注意力作簡要分析,這決定著我們?nèi)绾卧诘谝粫r間抓住受眾的注意力。

人類視覺感知到心理認知的過程要經(jīng)過信息的獲取、分析、歸納、解碼、儲存、概念、提取、使用等一系列加工階段,每個階段需要不同的人體組織和器官參與。簡單來講,人類視覺的特點是:

對亮度、運動、差異更敏感,對紅色相對于其他顏色更為敏感;

對于具備某些特點的視覺元素具備很強的“腦補”能力,比如空間距離較近的點往往被認為具有某些共同的特點;

對眼球中心正面物體的分辨率更高,這是由于人類晶狀體中心區(qū)域錐體細胞分布最為密集;

人們在觀察事物時習(xí)慣于將具有某種方向上的趨勢的物體視為連續(xù)物體;

人們習(xí)慣于使用“經(jīng)驗”去感知事物整體,而忽略局部信息。

這里引入一個概念——可視編碼,它數(shù)據(jù)信息映射為可視化元素的技術(shù),其通常具有表達直觀、易于理解和記憶的特性。數(shù)據(jù)包含屬性和值,相應(yīng)可視編碼也由兩部分組成:標(biāo)記和視覺通道,標(biāo)記代表數(shù)據(jù)屬性的分類,視覺通道表示人眼所能看到的各種元素的屬性,包括大小、形狀、顏色等,往往用來展示屬性的定量信息。例如,對于柱狀圖而言,標(biāo)記就是矩形,視覺通道就是矩形的顏色、高度或?qū)挾鹊取?/p>

數(shù)據(jù)可視化的設(shè)計目標(biāo)和制作原則在于信、達、雅,即一要精準(zhǔn)展現(xiàn)數(shù)據(jù)的差異、趨勢、規(guī)律,二要準(zhǔn)確傳遞核心思想,三要簡潔美觀,不攜帶冗余信息。結(jié)合人的視覺特點,很容易總結(jié)出好的數(shù)據(jù)可視化作品的基本特征:

讓用戶的視線聚焦在可視化結(jié)果中最重要的部分;

對于有對比需求的數(shù)據(jù),使用亮度、大小、形狀來進行編碼更佳;

使用盡量少的視覺通道編碼數(shù)據(jù),避免干擾信息。

3. 可視編碼的選擇

如同只學(xué)過視聽語言并不能設(shè)計出可用的電影分鏡一樣,數(shù)據(jù)可視化這一藝術(shù)設(shè)計色彩濃厚的工作絕非做過幾個餅圖、柱狀圖就能勝任。在開始涉足實踐講解之前,我們需要解決以下疑問:

可視化設(shè)計中優(yōu)先選擇哪些視覺通道?有多少種視覺通道可供使用?某個視覺通道能編碼什么信息,能包含多少信息量?視覺通道表達信息能力的區(qū)別?哪些視覺通道互不相關(guān)而哪些又相互影響?

看看下圖,或許能從一定程度上給出答案:

上圖列舉了數(shù)據(jù)可視化作品中常用的視覺編碼通道,針對同種數(shù)據(jù)類型,采用不同的視覺通道帶來的主觀認知差異很大。數(shù)值型適合用能夠量化的視覺通道表示,如坐標(biāo)、長度等,使用顏色表示的效果就大打折扣,且容易引起歧義;類似地,序列型適合用區(qū)分度明顯的視覺通道表示,類別型適合用易于分組的視覺通道。

需要指出的是,上圖蘊含的理念可以應(yīng)對絕大多數(shù)應(yīng)用場景下可視化圖形的設(shè)計“套路”,但數(shù)據(jù)可視化作為視覺設(shè)計的本質(zhì)決定了“山無常勢,水無常形”,任何可視化效果都拒絕生搬硬套,更不要說數(shù)據(jù)可視化的應(yīng)用還要受到業(yè)務(wù)、場景和受眾的影響。

4. 配色

相信每一個碼農(nóng)出身的數(shù)據(jù)分析師在做可視化設(shè)計時,都會對色彩如何搭配產(chǎn)生過困惑。色彩理論看起來簡單卻又乏味,用起來卻不是那么得心應(yīng)手。那么,如何讓數(shù)據(jù)可視化作品簡約、靈動、美觀?下面介紹一些通用技巧。

1)色調(diào)與明度的跨度都要大

要確保配色非常容易辨識與區(qū)分,它們的明度差異一定要夠大。明度差異需要全局考慮。但是,有一組明度跨度大的配色還不夠。配色越多樣,用戶越容易將數(shù)據(jù)與圖像聯(lián)系起來。如果能善加利用色調(diào)的變化,就能使用戶接受起來更加輕松。對于明度與色調(diào),跨度越大,就能承載越多的數(shù)據(jù)。下圖展示了相同色系下不同明度的色階對比:

2)仿照自然的配色

各行各業(yè)的設(shè)計師都知道這個小秘密,對于數(shù)據(jù)可視化工程師而言,這招更是屢試不爽。一個簡單有效的方法是:找出心儀的圖片,比如唯美的風(fēng)景照片,使用photoshop中“濾鏡—馬賽克—調(diào)整多邊形形狀和大小”即可看到該圖片中包含的各種顏色,然后利用吸管工具選出幾種顏色即可:

3)使用漸變

無論你需要2種顏色還是10種,漸變中都能提取出這些顏色,讓可視化圖表感覺自然,同時保有足夠的色調(diào)與明度差異。一個使用漸變的好方法就是:在Photoshop中拉輔助線到斷點位置,與數(shù)據(jù)的數(shù)量對應(yīng)上,然后持續(xù)對漸變進行測試與調(diào)整。

可以看到,配色表緊挨著頂部的灰度漸變,調(diào)整漸變疊加(之后就能得到精確的漸變色值),然后從那些斷點處選取顏色,測試配色在實際運用中的效果。

4)使用配色工具

網(wǎng)上各種免費資源比比皆是,對于想設(shè)計出靚麗效果又無計可施的人而言,多參考以下這些工具是一個好辦法:

ColorHunt——高質(zhì)量配色方案,能夠快速預(yù)覽,如果你只需要4種顏色,這是絕佳的資源;

Kuler——photoshop配色工具,Adobe家出的,應(yīng)該錯不了;

Chroma.js——Chroma.js是一個微型的JavaScript庫,適用于各種顏色處理的,可實現(xiàn)各種顏色的轉(zhuǎn)換和色階處理;

Color brewer——地圖配色利器,如果你對基于地圖的可視化配色方案感到困惑,這個在線工具應(yīng)該能夠幫到你。

此外,關(guān)于配色還有一些小技巧可供參考:遵循公司既定的品牌風(fēng)格;根據(jù)數(shù)據(jù)描述的對象來定,如數(shù)據(jù)描述的是咖啡,則可以考慮使用咖色系;使用季節(jié)或者節(jié)日相關(guān)主題的色彩;如果你實在對顏色搭配感到頭疼,那就多使用萬能的“灰色”和陰影。

統(tǒng)計圖表

統(tǒng)計圖表是使用最早的可視化圖形,在數(shù)百年的進化過程中,逐漸形成了基本“套路”,符合人類感知和認知,進而被廣泛接受。

常見于各種分析報告的有柱狀圖、折線圖、餅圖、散點圖、氣泡圖、雷達圖,對于這些最常用的圖表類型,下表可以為你指明大致方向:

我們在制作可視化圖表時,首先要從業(yè)務(wù)出發(fā),優(yōu)先挑選合理的、符合慣例的圖表,尤其是如果你的用戶層次比較多樣的情況下,請兼顧各個年齡段或者不同認知能力的用戶的需求;其次是根據(jù)數(shù)據(jù)的各種屬性和統(tǒng)計圖表的特點來選擇,例如餅圖并不適合用作展示絕對數(shù)值,只適用于反映各部分的比例。對于常用圖表,帶著目的出發(fā),遵循各種約束,相信你能找到合適的圖表:

除了常用的圖表之外,可供我們選擇的還有:

漏斗圖:漏斗圖適用于業(yè)務(wù)流程比較規(guī)范、周期長、環(huán)節(jié)多的流程分析,通過漏斗各環(huán)節(jié)業(yè)務(wù)數(shù)據(jù)的比較,能夠直觀地發(fā)現(xiàn)和說明問題所在。

(矩形)樹圖:一種有效的實現(xiàn)層次結(jié)構(gòu)可視化的圖表結(jié)構(gòu),適用于表示類似文件目錄結(jié)構(gòu)的數(shù)據(jù)集;

熱力圖:以特殊高亮的形式顯示訪客熱衷的頁面區(qū)域和訪客所在的地理區(qū)域的圖示,它基于GIS坐標(biāo),用于顯示人或物品的相對密度;

關(guān)系圖:基于3D空間中的點—線組合,再加以顏色、粗細等維度的修飾,適用于表征各節(jié)點之間的關(guān)系;

詞云:各種關(guān)鍵詞的集合,往往以字體的大小或顏色代表對應(yīng)詞的頻次;

桑基圖:一種有一定寬度的曲線集合表示的圖表,適用于展現(xiàn)分類維度間的相關(guān)性,以流的形式呈現(xiàn)共享同一類別的元素數(shù)量,比如展示特定群體的人數(shù)分布等;

日歷圖:顧名思義,以日歷為基本維度的對單元格加以修飾的圖表。

數(shù)據(jù)可視化的工具

新型的數(shù)據(jù)可視化產(chǎn)品層出不窮,基本上各種語言都有自己的可視化庫,傳統(tǒng)數(shù)據(jù)分析及BI軟件也都擴展出一定的可視化功能,再加上專門的用于可視化的成品軟件,我們的可選范圍實在是太多了。那么,我們要選擇的可視化工具,必須滿足互聯(lián)網(wǎng)爆發(fā)的大數(shù)據(jù)需求,必須快速的收集、篩選、分析、歸納、展現(xiàn)決策者所需要的信息,并根據(jù)新增的數(shù)據(jù)進行實時更新。

實時性:數(shù)據(jù)可視化工具必須適應(yīng)大數(shù)據(jù)時代數(shù)據(jù)量的爆炸式增長需求,必須快速的收集分析數(shù)據(jù)、并對數(shù)據(jù)信息進行實時更新;

簡單操作:數(shù)據(jù)可視化工具滿足快速開發(fā)、易于操作的特性,能滿足互聯(lián)網(wǎng)時代信息多變的特點;

更豐富的展現(xiàn):數(shù)據(jù)可視化工具需具有更豐富的展現(xiàn)方式,能充分滿足數(shù)據(jù)展現(xiàn)的多維度要求;

多種數(shù)據(jù)集成支持方式:數(shù)據(jù)的來源不僅僅局限于數(shù)據(jù)庫;很多數(shù)據(jù)可視化工具都支持團隊協(xié)作數(shù)據(jù)、數(shù)據(jù)倉庫、文本等多種方式,并能夠通過互聯(lián)網(wǎng)進行展現(xiàn)。

數(shù)據(jù)可視化主要通過編程和非編程兩類工具實現(xiàn)。主流編程工具包括以下三種類型:從藝術(shù)的角度創(chuàng)作的數(shù)據(jù)可視化,比較典型的工具是 Processing,它是為藝術(shù)家提供的編程語言;從統(tǒng)計和數(shù)據(jù)處理的角度,既可以做數(shù)據(jù)分析,又可以做圖形處理,如R,SAS;介于兩者之間的工具,既要兼顧數(shù)據(jù)處理,又要兼顧展現(xiàn)效果,D3.js、Echarts都是很不錯的選擇,二者這種基于Javascript的數(shù)據(jù)可視化工具更適合在互聯(lián)網(wǎng)上互動的展示數(shù)據(jù)。

1. 入門級

入門級的意思是該工具是可視化工作者必須掌握的技能,難度不一定小、門檻也不一定低。相反,對于可視化大拿來說,這些工具依舊起到四兩撥千斤的妙用。

Excel

別以為EXCEL只會處理表格,你可以把它當(dāng)成數(shù)據(jù)庫,也可以把它當(dāng)成IDE,甚至可以把它當(dāng)成數(shù)據(jù)可視化工具來使用。它可以創(chuàng)建專業(yè)的數(shù)據(jù)透視表和基本的統(tǒng)計圖表,但由于默認設(shè)置了顏色、線條和風(fēng)格,使其難以創(chuàng)建用于看上去“高大上”視覺效果。盡管如此,我仍然推薦你使用Excel。

Tableau

相信每一個接觸到數(shù)據(jù)可視化的人都聽說過Tableau,它需要一些結(jié)構(gòu)化的數(shù)據(jù), 也需要你懂一些BI。 它不需要編程,而僅僅通過簡單的拖拽操作即可完成驚艷的效果。對比Excel,它是專業(yè)應(yīng)對數(shù)據(jù)可視化方案的利器,主要表現(xiàn)在數(shù)據(jù)可視化、聚焦/深挖、靈活分析、交互設(shè)計等功能。Tableau最大的缺點在于它是商業(yè)軟件,個人使用的話只有14天的免費期,而官方售價不菲。

2. 在線數(shù)據(jù)可視化

Google Charts

Google Charts是一個免費的開源js庫,使用起來非常簡單,只需要在script標(biāo)簽中將src指向https://www.gstatic.com/charts/loader.js然后即可開始繪制。它支持HTML5/SVG,可以跨平臺部署,并特意為兼容舊版本的IE采用了vml。

在新版googlecharts 發(fā)布之前,google有個類似的產(chǎn)品叫做Google Charts API,不同之處在于后者使用http請求的方式將參數(shù)提交到api,而后接口返回一張png圖片。如打開http://chart.googleapis.com/chart?cht=bvg&chs=250x150&chd=s:Monkeys&chxt=x,y&chxs=0,ff0000,12,0,lt|1,0000ff,10,1,lt,即可顯示下圖:

Flot

Flot是一個很棒的線圖和條形圖創(chuàng)建工具,可以運用于支持canvas的所有瀏覽器——意味著大多數(shù)主流瀏覽器。這是一個jQuery庫,如果你已經(jīng)熟悉jQuery,你就可以容易的對圖像進行回調(diào)、風(fēng)格和行為操作。浮懸的優(yōu)點是你可以訪問大量的調(diào)用函數(shù),這樣就可以運行你自己的代碼。設(shè)定一種風(fēng)格,可以讓在用戶懸停鼠標(biāo)、點擊、移開鼠標(biāo)時展示不同的效果。比起其他制圖工具,浮懸給予你更多的靈活空間。浮懸提供的選項不多,但它可以很好地執(zhí)行常見的功能。

D3

D3(Data Driven Documents)是支持SVG渲染的另一種JavaScript庫。但是D3能夠提供大量線性圖和條形圖之外的復(fù)雜圖表樣式,例如Voronoi圖、樹形圖、圓形集群和單詞云等。D3.js是數(shù)據(jù)驅(qū)動文件(Data-Driven Documents)的縮寫,他通過使用HTMLCSS和SVG來渲染精彩的圖表和分析圖。D3對網(wǎng)頁標(biāo)準(zhǔn)的強調(diào)足以滿足在所有主流瀏覽器上使用的可能性,使你免于被其他類型架構(gòu)所捆綁的苦惱,它可以將視覺效果很棒的組件和數(shù)據(jù)驅(qū)動方法結(jié)合在一起。

Echarts

百度出品的優(yōu)秀產(chǎn)品之一,也是國內(nèi)目前開源項目中少有的精品。一個純 Javascript 的圖表庫,可以流暢的運行在 PC 和移動設(shè)備上,兼容當(dāng)前絕大部分瀏覽器,底層依賴輕量級的 Canvas 類庫 ZRender,提供直觀,生動,可交互,可高度個性化定制的數(shù)據(jù)可視化圖表。3.0版本中更是加入了更多豐富的交互功能以及更多的可視化效果,并且對移動端做了深度的優(yōu)化。Echarts最令人心動的是它豐富的圖表類型,以及極低的上手難度。

Highcharts

在Echarts出現(xiàn)之初,功能還不是那么完善,可視化工作者往往會選擇HighCharts。Highcharts 系列軟件包含 Highcharts JS,Highstock JS,Highmaps JS 共三款軟件,均為純 JavaScript 編寫的 HTML5 圖表庫。Highcharts 是一個用純 JavaScript 編寫的一個圖表庫, 能夠很簡單便捷的在 Web 網(wǎng)站或是 Web 應(yīng)用程序添加有交互性的圖表。Highstock 是用純 JavaScript 編寫的股票圖表控件,可以開發(fā)股票走勢或大數(shù)據(jù)量的時間軸圖表,Highmaps 是一款基于 HTML5 的優(yōu)秀地圖組件。

R

嚴(yán)格來說,R是一種數(shù)據(jù)分析語言,與matlab、GNU Octave并列。然而ggplot2的出現(xiàn)讓R成功躋身于可視化工具的行列,作為R中強大的作圖軟件包,ggplot2牛在其自成一派的數(shù)據(jù)可視化理念。它將數(shù)據(jù)、數(shù)據(jù)相關(guān)繪圖、數(shù)據(jù)無關(guān)繪圖分離,并采用圖層式的開發(fā)邏輯,且不拘泥于規(guī)則,各種圖形要素可以自由組合。當(dāng)熟悉了ggplot2的基本套路后,數(shù)據(jù)可視化工作將變得非常輕松而有條理。

DataV

阿里出品的數(shù)據(jù)可視化解決方案,之所以推薦DataV這個后起之秀,完全是因為淘寶雙“11”活動中實時互動大屏幕太搶眼了。DataV支持多種數(shù)據(jù)源,尤其是和阿里系各種數(shù)據(jù)庫完美銜接,如果你的數(shù)據(jù)本身就存在阿里云上,那選用DataV肯定是個省時省力的好辦法。圖表方面,DataV內(nèi)置了豐富的圖表模板,支持實時數(shù)據(jù)采集和解析。

3. 類GUI數(shù)據(jù)可視化

Crossfilter

Crossfilter 是一個用來展示大數(shù)據(jù)集的 JavaScript 庫,它可以把數(shù)據(jù)可視化和GUI控件結(jié)合起來,按鈕、下拉和滑塊演變成更復(fù)雜的界面元素,使你擴展內(nèi)容,同時改變輸入?yún)?shù)和數(shù)據(jù)。交互速度超快,甚至在上百萬或者更多數(shù)據(jù)下都很快。Crossfilter也是一種JavaScript庫,它可以在幾乎不影響速度的前提下對數(shù)據(jù)創(chuàng)建過濾器,將過濾后的數(shù)據(jù)用于展示,且涉及有限維度,因此可以完成對海量數(shù)據(jù)集的篩選與加載。

4. 進階工具

Processing

Processing 是用 Java 編程語言寫的,并且 Java 語言也是在語言樹中最接近 Processing 的。所以,如果您熟悉 C 或 Java 語言,Processing 將很容易學(xué)。Processing 并不包括 Java 語言的一些較為高級的特性,但這些特性中的很多特性均已集成到了 Processing。如今,圍繞它已經(jīng)形成了一個專門的社區(qū)(https://www.openprocessing.org),致力于構(gòu)建各種庫以供用這種語言和環(huán)境進行動畫、可視化、網(wǎng)絡(luò)編程以及很多其他的應(yīng)用。

Processing 是一個很棒的進行數(shù)據(jù)可視化的環(huán)境,具有一個簡單的接口、一個功能強大的語言以及一套豐富的用于數(shù)據(jù)以及應(yīng)用程序?qū)С龅臋C制。

Weka

Weka是一個能根據(jù)屬性分類和集群大量數(shù)據(jù)的優(yōu)秀工具,Weka不但是數(shù)據(jù)分析的強大工具,還能生成一些簡單的圖表。weka首先是一個數(shù)據(jù)挖掘的利器,它能夠快速導(dǎo)入我們的結(jié)構(gòu)化數(shù)據(jù),然后對數(shù)據(jù)屬性做分類、聚類分析,幫助我們理解數(shù)據(jù)。但他的可視化功能同樣不遜色,選擇界面中的visualization,你會立刻明白:是它讓你理解數(shù)據(jù),然后你才讓用戶可視化數(shù)據(jù)。

結(jié)語

我們所處的這個時代,是一個知識大爆發(fā)的時代。僅就編程這項技能來說,現(xiàn)在幾乎人人都能寫上一兩行,程序員這個群體也比十年前有了更多維度上的擴展。各種工具的使用門檻越來越低,帶來的是行業(yè)壁壘日漸消弭。會用某種可視化手段,并不是區(qū)分小白與專家的唯一標(biāo)準(zhǔn),筆者曾聽說有人拿unity、易語言這樣的神器來實現(xiàn)可視化。所以,眼花繚亂的工具永遠只是輔助,真正決定你在可視化道路上走多遠的,是你對可視化理念的準(zhǔn)確把握和執(zhí)著堅守。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 編程語言
    +關(guān)注

    關(guān)注

    10

    文章

    1945

    瀏覽量

    34746
  • 可視化
    +關(guān)注

    關(guān)注

    1

    文章

    1194

    瀏覽量

    20946

原文標(biāo)題:一文讀懂?dāng)?shù)據(jù)可視化

文章出處:【微信號:DBDevs,微信公眾號:數(shù)據(jù)分析與開發(fā)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    5G的核心不僅僅是技術(shù)

    5G不僅僅是技術(shù)上一個臺階,更重要的就是全新的用戶體驗。以前用戶難以體驗的應(yīng)用例如虛擬現(xiàn)實、增強現(xiàn)實、3D等,這些并不是可望不可及的,網(wǎng)絡(luò)、終端、配套的顯示技術(shù)等都是關(guān)鍵。
    發(fā)表于 11-06 09:35 ?1388次閱讀

    物聯(lián)網(wǎng)不僅僅是連接設(shè)備和無縫通信

    今天,物聯(lián)網(wǎng)(IoT)不僅僅是連接設(shè)備和無縫通信。新興的物聯(lián)網(wǎng)對貨物生產(chǎn)方式產(chǎn)生了深遠的影響,引發(fā)了另一次工業(yè)革命——工業(yè)4.0。工業(yè)4.0或第四次工業(yè)革命是當(dāng)前制造業(yè)自動數(shù)據(jù)交換的趨勢。它
    發(fā)表于 07-25 04:45

    為什么我們需要很少的Vccint引腳用于芯片而不僅僅是1個引腳?

    嗨,我目前正在使用Artix-7 FPGA進行低功耗技術(shù)的實驗,我觀察到很少有Vccint引腳連接到Artix-7芯片。我想知道為什么我們需要很少的Vccint引腳用于芯片而不僅僅是1個引腳?如果1
    發(fā)表于 08-26 15:33

    一般圖表做不了的分析,BI數(shù)據(jù)可視化圖表可以

    。目前,OurwayBI數(shù)據(jù)可視化工具已上線、優(yōu)化數(shù)十種可視化圖表,大家可隨時根據(jù)分析需求點擊應(yīng)用。數(shù)據(jù)
    發(fā)表于 01-15 10:22

    如何為sja1110創(chuàng)建一個新的圖像而不僅僅是使用GOLDVIP圖像?

    我想使用 SPI 下載具有不同配置和代碼庫的 sja1110 固件,如何為 sja1110 創(chuàng)建一個新的圖像而不僅僅是使用 GOLDVIP 圖像?謝謝
    發(fā)表于 04-04 08:01

    LED在投影機的運用 革新的不僅僅是技術(shù)

    LED在投影機的運用 革新的不僅僅是技術(shù)    在科技高速發(fā)展的今天,LED技術(shù)開始在視聽領(lǐng)域興起,這種新型光源有著諸多的好處與優(yōu)勢,也必將
    發(fā)表于 01-14 08:33 ?496次閱讀

    買液晶電視,您需要的不僅僅是超薄

    買液晶電視,您需要的不僅僅是超薄   據(jù)悉,日立Wooo系列超薄液晶電視的機身厚度僅為3.5cm,要比普通液晶電視薄10cm左右;有
    發(fā)表于 02-11 13:48 ?335次閱讀

    iPhone為何這么火?因為iPhone不僅僅是一個手機

    筆者認為是iPhone之所以如此火爆的重點所在。用一句概括即是,iPhone不僅僅是一個手機。
    發(fā)表于 01-14 10:38 ?1047次閱讀
    iPhone為何這么火?因為iPhone<b class='flag-5'>不僅僅是</b>一個手機

    不僅僅是iPhone8 蘋果還有興趣部署衛(wèi)星進行通信

    蘋果十周年之際不僅僅是iPhone 8有很多消息,居然還有衛(wèi)星的消息,蘋果這是要玩哪一出?
    發(fā)表于 04-23 02:24 ?872次閱讀

    傳感器數(shù)據(jù)融合:不僅僅是傳感器集成

    傳感器融合不僅僅是各個部分的總和。這是硬件和軟件集成的不懈努力。本文著重介紹了傳感器進展中最近的一些進展,以及如何將硬件和軟件結(jié)合在一起工作良好。
    發(fā)表于 06-22 11:31 ?12次下載
    傳感器<b class='flag-5'>數(shù)據(jù)</b>融合:<b class='flag-5'>不僅僅是</b>傳感器集成

    百年汽車造型的變化,并不僅僅是為了好看?

    事物總是在不斷的發(fā)展,汽車亦不過如此。汽車從誕生至今也有超過一百三十年的歷史,而在這百年中,汽車最明顯的變化莫過于外觀,從最原始的馬車造型逐步進化到現(xiàn)代的流線型車身,這些變化并不僅僅是為了好看,而是有著更重大的意義。
    的頭像 發(fā)表于 06-21 15:56 ?4335次閱讀

    BI可視化智能分析平臺開發(fā),大數(shù)據(jù)可視化平臺

    。阿里可能會得出今年買什么種類產(chǎn)品的人增多,從而分析出原因,制定來年的計劃。數(shù)據(jù)可視化不僅僅是統(tǒng)計圖表。本質(zhì)上,任何能夠借助于圖形的方式展示事物原理、規(guī)律、邏輯的方法都叫
    發(fā)表于 02-28 09:39 ?597次閱讀

    工業(yè)互聯(lián)網(wǎng)帶來的不僅僅是流程上的改變 更重要是管理方式的變革

    工業(yè)互聯(lián)網(wǎng)所帶來的不僅僅是流程上的改變,更重要的是帶來了管理思維、管理方式的變革。時代在變,我們的商業(yè)模式必須隨之改變。
    的頭像 發(fā)表于 05-17 15:13 ?2568次閱讀
    工業(yè)互聯(lián)網(wǎng)帶來的<b class='flag-5'>不僅僅是</b>流程上的改變 更重要是管理方式的變革

    PCB設(shè)計不僅僅是技術(shù),還是藝術(shù)資料下載

    電子發(fā)燒友網(wǎng)為你提供PCB設(shè)計不僅僅是技術(shù),還是藝術(shù)資料下載的電子資料下載,更有其他相關(guān)的電路圖、源代碼、課件教程、中文資料、英文資料、參考設(shè)計、用戶指南、解決方案等資料,希望可以幫助到廣大的電子工程師們。
    發(fā)表于 03-29 16:55 ?6次下載
    PCB設(shè)計<b class='flag-5'>不僅僅是</b>技術(shù),還是藝術(shù)資料下載

    一個非常棒的可視化庫:PyG2Plot

    螞蟻金服開源一個基于圖形語法,面向數(shù)據(jù)分析的統(tǒng)計圖表引擎。后來又在其基礎(chǔ)上,封裝出業(yè)務(wù)上常用的統(tǒng)計圖表庫—— G2Plot 。 不過現(xiàn)在
    的頭像 發(fā)表于 10-21 11:32 ?1230次閱讀
    一個非常棒的<b class='flag-5'>可視化</b>庫:PyG2Plot