0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一個助你事半功倍的數(shù)據(jù)挖掘工具!

數(shù)據(jù)分析與開發(fā) ? 來源:數(shù)據(jù)分析與開發(fā) ? 2023-01-10 15:53 ? 次閱讀

Pandas模塊當(dāng)中,對于表格數(shù)據(jù)的分組操作(groupby)和透視表(pivot_table)的制作一直都是比較常見的,今天小編為大家分享一個數(shù)據(jù)分析的利器,能夠自動為我們完成上述提到的一系列操作,并且?guī)в?code style="margin-right:2px;margin-left:2px;padding:2px 4px;font-size:14px;color:rgb(30,107,184);background-color:rgba(27,31,35,.05);font-family:'Operator Mono', Consolas, Monaco, Menlo, monospace;">GUI界面,所以使用起來非常的方便。

PivotTableJS

看名字我們就能知道,該模塊是專門用來生成透視表(pivot_table),而且是用JavaScript代碼來構(gòu)建的,由于其有GUI界面,所以我們在進行數(shù)據(jù)分析與可視化操作的時候并不需要寫多少代碼。

當(dāng)然我們先用pip命令來安裝該模塊,代碼如下

pipinstallPivotTableJS

加載數(shù)據(jù)集

那么首先,我們先來加載數(shù)據(jù)集,這里導(dǎo)入Pandas模塊


	

importpandasaspd df=pd.read_csv("employee_dataset.csv") df.head()

output

8d475dee-9014-11ed-bfe3-dac502259ad0.png

牛刀小試

這里我們嘗試來調(diào)用pivottablejs模塊當(dāng)中的pivot_ui方法,只需兩行代碼


	

frompivottablejsimportpivot_ui pivot_ui(df)

output

8d62737c-9014-11ed-bfe3-dac502259ad0.png

這里可能需要等待1-2分鐘左右的時間來供其加載,隨后我們就能看到如上圖所示的窗口,窗口中包括了表格當(dāng)中的每一列的字段、可視化圖表的各種形式等等

8d75f33e-9014-11ed-bfe3-dac502259ad0.png

同時我們也可以拖拽指定的列到空白的窗口中,對其進行分組統(tǒng)計以及透視表的制作,如下圖所示

8d907862-9014-11ed-bfe3-dac502259ad0.gif

而要是我們想要進行可視化操作,只需要在下拉框中選中,例如我們想要繪制的是直方圖,

8da72364-9014-11ed-bfe3-dac502259ad0.gif

分組統(tǒng)計

接下來我們進行分組(groupby)操作,例如我們想要查看一下員工狀態(tài)(Employee_Status)的分組統(tǒng)計,只需要將該列拖拽至空白的區(qū)域即可

8dce976e-9014-11ed-bfe3-dac502259ad0.png

我們可以看到員工分為是全職員工以及實習(xí)生,分別是有791位和209位,當(dāng)然除了計數(shù)(count)之外,我們還能夠計算平均值、中位數(shù)、最大/最小值等一系列統(tǒng)計方法,例如我們想要計算一下全職員工和實習(xí)生的平均工資,就可以這么來操作

8df19d0e-9014-11ed-bfe3-dac502259ad0.gif

我們還可以更進一步,將上面的結(jié)果進行可視化展示,如下所示

8e10ad8e-9014-11ed-bfe3-dac502259ad0.gif

透視表

對于透視表而言,pivottablejs模塊實現(xiàn)起來也格外的簡單,我們只需要在上述操作的基礎(chǔ)之上,將列拖拽到右邊空白的長方形區(qū)域當(dāng)中,例如我們想要看一下分布在不同城市當(dāng)中不同職位員工的分布,就可以這么來做

8e65f366-9014-11ed-bfe3-dac502259ad0.gif

當(dāng)然該模塊給我們帶來的便利和自身所具備的功能遠不止此,大家可以安裝一下該模塊,然后在空余的時間中自行探索。

當(dāng)然我們看來該模塊還存在著一個小小的bug,大家可以嘗試用其他版本來試一下,小編在這里用的是0.9.0

審核編輯 :李倩



聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 模塊
    +關(guān)注

    關(guān)注

    7

    文章

    2731

    瀏覽量

    47681
  • 數(shù)據(jù)挖掘
    +關(guān)注

    關(guān)注

    1

    文章

    406

    瀏覽量

    24300
  • 可視化
    +關(guān)注

    關(guān)注

    1

    文章

    1200

    瀏覽量

    21020

原文標(biāo)題:介紹一個助你事半功倍的數(shù)據(jù)挖掘工具!

文章出處:【微信號:DBDevs,微信公眾號:數(shù)據(jù)分析與開發(fā)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    精密空調(diào)—這些工具讓精密空調(diào)安裝事半功倍

    在安裝精密空調(diào)的過程中,需要使用到多種專業(yè)工具,以確保精密空調(diào)安裝過程的順利進行和精密空調(diào)的正常運行。下面聊下安裝精密空調(diào)需要使用到的工具。 1、活板手與扳手:活板手常見規(guī)格為200mm
    的頭像 發(fā)表于 01-24 10:41 ?55次閱讀
    精密空調(diào)—這些<b class='flag-5'>工具</b>讓精密空調(diào)安裝<b class='flag-5'>事半功倍</b>

    七款經(jīng)久不衰的數(shù)據(jù)可視化工具!

    、圖形等形式展示,使數(shù)據(jù)更易于理解與分析。本文將深入探討數(shù)據(jù)可視化工具的概念、種類及其應(yīng)用,同時,我們將推薦款高效好用的數(shù)據(jù)可視化
    發(fā)表于 01-19 15:24

    數(shù)據(jù)驅(qū)動AI工具在哪

    數(shù)據(jù)驅(qū)動AI工具并不遙遠,它們就存在于我們的日常生活中,只是我們可能沒有意識到。這些工具通常被嵌入到各種應(yīng)用程序、軟件和服務(wù)中,為我們提供便利。接下來,AI部落小編為您詳細介紹數(shù)據(jù)驅(qū)動
    的頭像 發(fā)表于 12-09 10:52 ?171次閱讀

    分享keil MDK編譯信息增強工具

    今天給大家分享 keil MDK 編譯信息增強工具:keil-build-viewer. 1 keil-build-viewer介紹 這是
    的頭像 發(fā)表于 11-14 11:01 ?673次閱讀

    更強的無線(雙)串口數(shù)據(jù)記錄 調(diào)試工具

    1、介紹這是具備Wi-Fi功能的無線雙串口調(diào)試工具;除了基本的無線串口外還具備將串口數(shù)據(jù)自動記錄到TF卡,可自定義數(shù)據(jù)上報地址,預(yù)留可定
    的頭像 發(fā)表于 08-02 08:11 ?761次閱讀
    更強的無線(雙)串口<b class='flag-5'>數(shù)據(jù)</b>記錄 調(diào)試<b class='flag-5'>工具</b>

    中科曙光受邀參加第十屆中國數(shù)據(jù)挖掘會議

    近日,國內(nèi)數(shù)據(jù)挖掘領(lǐng)域最主要的學(xué)術(shù)活動之—第十屆中國數(shù)據(jù)挖掘會議(CCDM2024)于山東泰安舉行,中科曙光參與并分享了曙光AI構(gòu)建產(chǎn)學(xué)研
    的頭像 發(fā)表于 08-01 10:43 ?629次閱讀

    數(shù)據(jù)分析的工具有哪些

    數(shù)據(jù)分析是涉及收集、處理、分析和解釋數(shù)據(jù)以得出有意義見解的過程。在這個過程中,使用正確的工具至關(guān)重要。以下是
    的頭像 發(fā)表于 07-05 14:54 ?1010次閱讀

    數(shù)據(jù)采集方法有哪些?工具有哪些?

    上收集數(shù)據(jù)。它通過模擬用戶瀏覽網(wǎng)頁的行為,獲取網(wǎng)頁上的文本、圖片、鏈接等信息。網(wǎng)絡(luò)爬蟲可以應(yīng)用于各種場景,如市場調(diào)研、社交媒體分析、新聞聚合等。 常用的網(wǎng)絡(luò)爬蟲工具有: Scrapy:
    的頭像 發(fā)表于 07-01 15:35 ?1569次閱讀

    常見的數(shù)據(jù)采集工具的介紹

    數(shù)據(jù)采集是數(shù)據(jù)分析和處理的基礎(chǔ),它涉及到從各種數(shù)據(jù)源中提取、收集和整理數(shù)據(jù)的過程。數(shù)據(jù)采集工具
    的頭像 發(fā)表于 07-01 14:51 ?977次閱讀

    數(shù)據(jù)中臺工具的選型要點

    數(shù)據(jù)中臺工具扮演著舉足輕重的角色。想要全面理解數(shù)據(jù)中臺工具的意義、作用以及應(yīng)用方式,就必須深入探討這概念以及相關(guān)實踐。
    的頭像 發(fā)表于 04-24 15:07 ?346次閱讀

    自己寫了手機端燒錄程序工具,把bin文件數(shù)據(jù)寫從0x8000000開始地址,完成后無法啟動怎么解決?

    我自己寫了手機端類似的燒錄工具代替pc端的工具,負責(zé)把bin文件寫到stm32f4 flash中。但是寫完數(shù)據(jù)后,重新上電不啟動。我通過
    發(fā)表于 04-01 07:16

    賊拉好用的嵌入式數(shù)據(jù)可視化工具

    今天給大家分享比較實用的開源、免費的數(shù)據(jù)可視化小工具:SerialStudio。首先用張圖給大家看
    的頭像 發(fā)表于 03-07 08:09 ?535次閱讀
    賊拉好用的<b class='flag-5'>一</b><b class='flag-5'>個</b>嵌入式<b class='flag-5'>數(shù)據(jù)</b>可視化<b class='flag-5'>工具</b>

    嵌入式數(shù)據(jù)可視化工具——Serial Studio

    Serial Studio從名稱就可以看的出來,它是款串口(Serial)可視化(Studio)工具:主要用于嵌入式開發(fā)者的跨平臺數(shù)據(jù)可視化工具(應(yīng)用軟件,或上位機軟件)。
    的頭像 發(fā)表于 03-04 10:12 ?9071次閱讀

    挖掘機生產(chǎn)裝配線無線通訊應(yīng)用

    、合理地使用工裝、專用工具,提高裝配質(zhì)量和生產(chǎn)操作安全性,便于集中管理;大大減輕了勞動強度,適應(yīng)了上批量,上效益的要求。 挖掘機生產(chǎn)裝配線的無線通訊項目共涉及兩應(yīng)用場景,一個是對牽引
    的頭像 發(fā)表于 02-22 09:44 ?431次閱讀
    <b class='flag-5'>挖掘</b>機生產(chǎn)裝配線無線通訊應(yīng)用

    數(shù)據(jù)挖掘的應(yīng)用領(lǐng)域,并舉例說明

    數(shù)據(jù)挖掘(Data Mining)是種從大量數(shù)據(jù)中提取出有意義的信息和模式的技術(shù)。它結(jié)合了數(shù)據(jù)庫、統(tǒng)計學(xué)、機器學(xué)習(xí)和人工智能等領(lǐng)域的理論和
    的頭像 發(fā)表于 02-03 14:19 ?3273次閱讀