在Pandas
模塊當(dāng)中,對于表格數(shù)據(jù)的分組操作(groupby
)和透視表(pivot_table
)的制作一直都是比較常見的,今天小編為大家分享一個數(shù)據(jù)分析的利器,能夠自動為我們完成上述提到的一系列操作,并且?guī)в?code style="margin-right:2px;margin-left:2px;padding:2px 4px;font-size:14px;color:rgb(30,107,184);background-color:rgba(27,31,35,.05);font-family:'Operator Mono', Consolas, Monaco, Menlo, monospace;">GUI界面,所以使用起來非常的方便。
PivotTableJS
看名字我們就能知道,該模塊是專門用來生成透視表(pivot_table
),而且是用JavaScript
代碼來構(gòu)建的,由于其有GUI
界面,所以我們在進行數(shù)據(jù)分析與可視化操作的時候并不需要寫多少代碼。
當(dāng)然我們先用pip
命令來安裝該模塊,代碼如下
pipinstallPivotTableJS
加載數(shù)據(jù)集
那么首先,我們先來加載數(shù)據(jù)集,這里導(dǎo)入Pandas
模塊
importpandasaspd df=pd.read_csv("employee_dataset.csv") df.head()
output
牛刀小試
這里我們嘗試來調(diào)用pivottablejs
模塊當(dāng)中的pivot_ui
方法,只需兩行代碼
frompivottablejsimportpivot_ui pivot_ui(df)
output
這里可能需要等待1-2分鐘左右的時間來供其加載,隨后我們就能看到如上圖所示的窗口,窗口中包括了表格當(dāng)中的每一列的字段、可視化圖表的各種形式等等
同時我們也可以拖拽指定的列到空白的窗口中,對其進行分組統(tǒng)計以及透視表的制作,如下圖所示
而要是我們想要進行可視化操作,只需要在下拉框中選中,例如我們想要繪制的是直方圖,
分組統(tǒng)計
接下來我們進行分組(groupby
)操作,例如我們想要查看一下員工狀態(tài)(Employee_Status)的分組統(tǒng)計,只需要將該列拖拽至空白的區(qū)域即可
我們可以看到員工分為是全職員工以及實習(xí)生,分別是有791位和209位,當(dāng)然除了計數(shù)(count
)之外,我們還能夠計算平均值、中位數(shù)、最大/最小值等一系列統(tǒng)計方法,例如我們想要計算一下全職員工和實習(xí)生的平均工資,就可以這么來操作
我們還可以更進一步,將上面的結(jié)果進行可視化展示,如下所示
透視表
對于透視表而言,pivottablejs
模塊實現(xiàn)起來也格外的簡單,我們只需要在上述操作的基礎(chǔ)之上,將列拖拽到右邊空白的長方形區(qū)域當(dāng)中,例如我們想要看一下分布在不同城市當(dāng)中不同職位員工的分布,就可以這么來做
當(dāng)然該模塊給我們帶來的便利和自身所具備的功能遠不止此,大家可以安裝一下該模塊,然后在空余的時間中自行探索。
當(dāng)然我們看來該模塊還存在著一個小小的bug,大家可以嘗試用其他版本來試一下,小編在這里用的是0.9.0
審核編輯 :李倩
-
模塊
+關(guān)注
關(guān)注
7文章
2731瀏覽量
47681 -
數(shù)據(jù)挖掘
+關(guān)注
關(guān)注
1文章
406瀏覽量
24300 -
可視化
+關(guān)注
關(guān)注
1文章
1200瀏覽量
21020
原文標(biāo)題:介紹一個助你事半功倍的數(shù)據(jù)挖掘工具!
文章出處:【微信號:DBDevs,微信公眾號:數(shù)據(jù)分析與開發(fā)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論