0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

三種制作詞云圖的方法,你覺(jué)得用哪一種更方便?

機(jī)智云 ? 2022-10-18 14:54 ? 次閱讀

如上所示,就是常見(jiàn)的詞云圖。

所謂詞云圖,又稱文字云,是通過(guò)對(duì)一個(gè)或多個(gè)關(guān)鍵詞進(jìn)行重復(fù)的、字體大小顏色不一的、不規(guī)則的排列,使其看上去類似于某種形狀的圖片,是對(duì)文本中出現(xiàn)頻率較高的“關(guān)鍵詞”予以視覺(jué)化的展現(xiàn)。

詞云圖能過(guò)濾掉大量的低頻低質(zhì)的文本信息,使得瀏覽者只要一眼掃過(guò)文本就可領(lǐng)略文本的主旨。

關(guān)鍵詞云圖生成器作為生成云圖的一種工具,簡(jiǎn)化了制作過(guò)程。目前國(guó)內(nèi)外有很多關(guān)鍵詞云圖在線生成器,普遍按月或按年收費(fèi),在付費(fèi)時(shí)候盡量選擇可靠性強(qiáng)的。小編之前就遇到過(guò)付費(fèi)后,沒(méi)多久網(wǎng)站就消失不見(jiàn)了。

那么如何才能自己來(lái)做詞云圖呢?有幾種常見(jiàn)方法

1、使用WordArtWordArt是國(guó)外網(wǎng)站,支持自定義字體、詞云形狀、顏色等,做出來(lái)的詞云圖酷炫、精美,但訪問(wèn)時(shí)響應(yīng)會(huì)比較緩慢。1.1 登錄網(wǎng)站W(wǎng)ordArt.com1.2 點(diǎn)擊Words-Import words導(dǎo)入事先準(zhǔn)備好的關(guān)鍵詞與其對(duì)應(yīng)詞頻,或是直接在對(duì)話框中輸入相應(yīng)關(guān)鍵詞。同時(shí)在頻數(shù),顏色,角度,字體中進(jìn)行設(shè)計(jì),以實(shí)現(xiàn)預(yù)設(shè)效果。8ebd3dd8-4e47-11ed-b116-dac502259ad0.png說(shuō)明:

  • Fonts:字體設(shè)置。該工具默認(rèn)字體為英文,如果詞云內(nèi)容為英文可以使用素材提供的字體,而涉及到中文內(nèi)容時(shí)我們需要選擇自行添加字體或是選擇素材庫(kù)中的Noto Sans S Chinese(可以識(shí)別部分中文)。
  • Shapes:設(shè)計(jì)詞云的形狀??梢赃x擇提供的素材庫(kù)中的形狀也可以選擇Add Image/Add Text來(lái)自定義形狀。這里選擇輸入數(shù)字“2020”并在選項(xiàng)卡中設(shè)計(jì)斜體、輪廓、字體、背景以及字體顏色,設(shè)計(jì)完成后單擊Add將形狀添加進(jìn)來(lái)。
  • Layout:內(nèi)容布局。在該選項(xiàng)卡中,可以更改設(shè)計(jì)文字方向和布局排列方式,該工具提供了許多現(xiàn)成的組合方案,只需按需加以勾選即可。同時(shí),在Words amount ,Density中也可以對(duì)填充內(nèi)容進(jìn)行設(shè)計(jì)。
  • Style:詞云設(shè)計(jì),主要涉及關(guān)鍵詞具體內(nèi)容的編輯設(shè)計(jì)。通過(guò)參數(shù)調(diào)整,對(duì)背景以及底色進(jìn)行編輯修改。

1.3 生成詞云:?jiǎn)螕鬡isualize,即可生成詞云圖并預(yù)覽效果。1.4 導(dǎo)出圖片:點(diǎn)擊DOWNLOAD (選擇圖片格式)即可下載詞云圖。8ed7e8cc-4e47-11ed-b116-dac502259ad0.png8ea4df54-4e47-11ed-b116-dac502259ad0.png2、借助開(kāi)源軟件word-cloud是一款為 java 設(shè)計(jì)的云圖生成工具。目前該項(xiàng)目開(kāi)源,地址在https://github.com/houbb/word-cloud

特性

極簡(jiǎn) api,一行代碼搞定一切

支持自定義云圖背景

支持中英文分詞,默認(rèn)對(duì)用戶透明

支持停頓詞過(guò)濾,默認(rèn)對(duì)用戶透明

支持各種用戶自定義配置

Maven引入

com.github.houbb
word-cloud
1.2.2

使用

WordCloudHelper.wordCloud("該作講述的是一個(gè)名為德特茅斯的衰落小鎮(zhèn)下掩埋著一個(gè)古老的廢棄王國(guó),名叫圣巢。這個(gè)王國(guó)被瘟疫所侵蝕而廢棄,廢棄的原因則是因?yàn)槊麨檩椆獾墓庵派?,她可以通過(guò)思想來(lái)傳播瘟疫,被瘟疫侵蝕的蟲(chóng)子都會(huì)被本能所支配,失去心智。\n" +
"這個(gè)王國(guó)的主人——蒼白之王,自然不會(huì)坐視不管,他在圣巢范圍之下的深淵,利用另一種遠(yuǎn)古力量“虛空”可以壓制光明的特性,制造了容器一族。其中一位被選中的容器用來(lái)封印瘟疫,并被命名為空洞騎士。為了封印的穩(wěn)固,白王尋找了三個(gè)守夢(mèng)人來(lái)進(jìn)一步鞏固封印,三位守夢(mèng)人的名稱分別為守望者 - 盧瑞恩,導(dǎo)師 - 莫諾蒙,野獸 - 赫拉。但之后蒼白之王不知去向,不完美的容器的力量的也變得逐漸虛弱,最終被輻光控制。主角就要穿過(guò)圣巢的各地,在安息之地中,我們受到曾經(jīng)輻光的信徒和眷族——飛蛾族唯一留下的族人的幫助,獲得了和輻光力量同源的夢(mèng)之武器——夢(mèng)之釘。夢(mèng)之釘可以讀取生物內(nèi)心的想法,并可以打破守夢(mèng)人的保護(hù),進(jìn)入到其夢(mèng)境之中殺死守夢(mèng)人。殺死了三位守夢(mèng)人并解開(kāi)封印后,可選的結(jié)局有到達(dá)十字路里的黑卵神殿打敗空洞騎士或去到在“尋神者”更新中新加入的地點(diǎn)“神居”并挑戰(zhàn)圣巢萬(wàn)神殿。");

添加背景

//以鯨魚(yú)的背景,可以讓文字以圖像的形式展現(xiàn):
String imagePath = "backgrounds\\whale_small.png";
WordCloudHelper.wordCloud(text,"out_bg.png",imagePath);

效果如下8f11f620-4e47-11ed-b116-dac502259ad0.png8ea4df54-4e47-11ed-b116-dac502259ad0.png3、使用python工具使用Python庫(kù)jieba,jieba是一個(gè)非常好用的中文工具,是以分詞起家的,但是功能比分詞要強(qiáng)大很多。8f410212-4e47-11ed-b116-dac502259ad0.pngjieba分詞有三種模式:
8f555316-4e47-11ed-b116-dac502259ad0.pngjieba.cut返回的結(jié)構(gòu)都是一個(gè)可迭代的 generator,可以使用 for 循環(huán)來(lái)獲得分詞后得到的每一個(gè)詞語(yǔ)(unicode)。

jieba.cut方法接受三個(gè)輸入?yún)?shù):

需要分詞的字符串

cut_all 參數(shù)用來(lái)控制是否采用全模式,一般情況下,cut_all為False

HMM 參數(shù)用來(lái)控制是否使用 HMM 模型

示例:使用“Star.jpg”作為模板圖片和“myword.txt”文本制作詞云圖
Star.jpg

8f73b0a4-4e47-11ed-b116-dac502259ad0.png

myword.txt

詳細(xì)代碼

###導(dǎo)入庫(kù)
#導(dǎo)入wordcloud詞云制作第三方庫(kù),并導(dǎo)入WordCloud.ImageColorGenerator兩個(gè)模塊 from wordcloud import WordCloud.imageColorGenerator

#導(dǎo)入imageio庫(kù)
importimageio

# 導(dǎo)入jieba庫(kù)
importjieba

### 圖片處理
# 用imageio庫(kù)中的imread函數(shù)讀取本地圖片
testmg=imageio.imread("Star.jpg")

# 調(diào)用wordcloud庫(kù)中的ImageColorGenerator函數(shù)
image_color=ImageColorGenerator(testimg)

# 給WordCloud函數(shù)傳入?yún)?shù)設(shè)置圖片相關(guān)屬性
test=WordCloud(mask=testimg,#將testng的值賦值給mask用作遮罩圖
width=500,#輸出圖片寬度為500px
height=500,#輸出圖片高度為500px
background_color="white",#輸出圖片背景顏色為白色
font-path="msyh.ttc"#字體路徑為微軟雅黑
scale=15)#畫布放大比例為15

###文本處理
# 引用外部文件,并用utf-8的編碼方式
txt=open("myword.txt",encoding="utf-8").read()

# 調(diào)用詞云對(duì)象test的generate方法,導(dǎo)入文本
# 使用jieba分詞的精確模式為文本進(jìn)行分詞
test=test.recolor(color_func=image_color)

###輸出處理
#將生成的詞云保存為result.png圖片文件,保存到當(dāng)前文件夾中
test.to_file("result.png")

效果圖

8f87d872-4e47-11ed-b116-dac502259ad0.png

詞云圖不僅能用來(lái)突出關(guān)鍵詞,減少信息冗余,還能用于用戶圖像分析,快來(lái)試試吧。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 云圖
    +關(guān)注

    關(guān)注

    3

    文章

    7

    瀏覽量

    4525
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    示波器的三種觸發(fā)模式

    示波器的觸發(fā)方式不僅影響波形捕捉的時(shí)機(jī),還決定了顯示的波形是否穩(wěn)定。 常見(jiàn)的觸發(fā)模式有三種: 單次觸發(fā) (Single)、 正常觸發(fā) (Normal)和 自動(dòng)觸發(fā) (Auto)。下面將對(duì)這三種觸發(fā)
    的頭像 發(fā)表于 01-07 11:04 ?1846次閱讀
    示波器的<b class='flag-5'>三種</b>觸發(fā)模式

    什么是PID調(diào)節(jié)器的三種模式

    PID調(diào)節(jié)器是一種廣泛應(yīng)用于工業(yè)控制系統(tǒng)中的控制器,它根據(jù)給定的參考值(設(shè)定值)和實(shí)際測(cè)量值(過(guò)程變量)之間的偏差來(lái)調(diào)整控制信號(hào),以達(dá)到控制目標(biāo)。PID調(diào)節(jié)器的名稱來(lái)源于其個(gè)基本控制動(dòng)作:比例
    的頭像 發(fā)表于 11-06 10:38 ?877次閱讀

    基本放大電路有哪三種

    電路(簡(jiǎn)稱共基放大電路)和共集電極放大電路(簡(jiǎn)稱共集放大電路)。以下是對(duì)這三種基本放大電路的詳細(xì)分析: 、共發(fā)射極放大電路(共射放大電路) 共發(fā)射極放大電路是最常見(jiàn)的放大電路形式之。在這種電路中,輸入信號(hào)
    的頭像 發(fā)表于 10-15 11:07 ?2399次閱讀

    mosfet的三種工作狀態(tài)及工作條件是什么

    的工作狀態(tài)及工作條件對(duì)于理解和設(shè)計(jì)相關(guān)電路至關(guān)重要。以下是MOSFET的三種主要工作狀態(tài)及其工作條件的介紹。 、MOSFET的三種工作狀態(tài) MOSFET根據(jù)其柵源電壓(VGS)和漏源電壓(VDS
    的頭像 發(fā)表于 10-06 16:51 ?3496次閱讀

    替換TL084最合適的運(yùn)放是哪一種?

    麻煩問(wèn)下,替換TL084最合適的運(yùn)放是哪一種?有源音箱上用的 另外OPA4134UA和OPA4134UAE4有什么區(qū)別?
    發(fā)表于 09-25 07:31

    光纖測(cè)試方法有哪三種

    光纖測(cè)試是確保光纖通信系統(tǒng)性能和可靠性的重要環(huán)節(jié)。光纖測(cè)試方法多樣,主要包括插入損耗測(cè)試、回波損耗測(cè)試和光纖端面檢查。以下是對(duì)這三種測(cè)試方法的介紹: 1. 插入損耗測(cè)試 插入損耗測(cè)試是測(cè)量光纖鏈路中
    的頭像 發(fā)表于 09-24 09:31 ?1589次閱讀

    單片機(jī)的三種總線結(jié)構(gòu)

    單片機(jī)的三種總線結(jié)構(gòu)包括地址總線(Address Bus, AB)、數(shù)據(jù)總線(Data Bus, DB)和控制總線(Control Bus, CB)。這三種總線在單片機(jī)內(nèi)部及與外部設(shè)備之間的數(shù)據(jù)傳輸
    的頭像 發(fā)表于 09-10 11:32 ?4697次閱讀

    vim的三種工作模式有哪些

    Vim是個(gè)功能強(qiáng)大的文本編輯器,它具有三種工作模式:普通模式、插入模式和命令行模式。以下是對(duì)這三種模式的介紹: 普通模式(Normal Mode) 普通模式是Vim的默認(rèn)模式,當(dāng)啟動(dòng)Vim時(shí),它會(huì)
    的頭像 發(fā)表于 08-30 14:52 ?1030次閱讀

    MCUXpresso IDE下在線聯(lián)合調(diào)試雙核MCU工程的三種方法

    大家好,我是痞子衡,是正經(jīng)搞技術(shù)的痞子。今天痞子衡給大家分享的是MCUXpresso IDE下在線聯(lián)合調(diào)試i.MXRT1170雙核工程的三種方法
    的頭像 發(fā)表于 08-08 15:18 ?858次閱讀
    MCUXpresso IDE下在線聯(lián)合調(diào)試雙核MCU工程的<b class='flag-5'>三種方法</b>

    pwm逆變電路的控制方法有哪三種

    的大小。本文將介紹PWM逆變電路的三種控制方法:正弦波PWM控制、空間矢量PWM控制和預(yù)測(cè)控制。 正弦波PWM控制 正弦波PWM控制是一種基本的PWM控制方法,其主要思想是通過(guò)調(diào)整脈沖
    的頭像 發(fā)表于 08-08 15:04 ?1697次閱讀

    數(shù)字示波器的測(cè)量方法有哪三種

    數(shù)字示波器是一種廣泛應(yīng)用于電子測(cè)量領(lǐng)域的儀器,它能夠?qū)崟r(shí)顯示電壓波形,幫助工程師和技術(shù)人員對(duì)電子信號(hào)進(jìn)行分析和測(cè)量。數(shù)字示波器的測(cè)量方法有很多種,不同的測(cè)量方法適用于不同的應(yīng)用場(chǎng)景。以下是三種
    的頭像 發(fā)表于 07-17 18:02 ?2482次閱讀

    放大電路的三種組態(tài)可以放大什么

    是對(duì)這三種放大電路組態(tài)的介紹。 1. 共射放大電路(Common Emitter Amplifier) 共射放大電路是三種組態(tài)中最常用的一種,其特點(diǎn)是具有較高的電壓增益和中等的電流增益。這種電路通常使用雙極型晶體管(BJT)或場(chǎng)
    的頭像 發(fā)表于 07-09 14:31 ?1690次閱讀

    電壓型逆變器可具體分為哪三種?

    電壓型逆變器是一種將直流電能轉(zhuǎn)換為交流電能的電力電子裝置,廣泛應(yīng)用于電力系統(tǒng)、工業(yè)控制、新能源發(fā)電等領(lǐng)域。根據(jù)其工作原理和結(jié)構(gòu)特點(diǎn),電壓型逆變器可以分為三種類型:?jiǎn)蜗嚯妷盒湍孀兤鳌?b class='flag-5'>三相電壓型逆變器
    的頭像 發(fā)表于 07-05 16:56 ?1002次閱讀

    鋰離子超級(jí)電容器跟超級(jí)電容器哪一種更加好?

    鋰離子超級(jí)電容器和普通超級(jí)電容器各有其優(yōu)勢(shì)和特點(diǎn),具體哪一種更好取決于應(yīng)用場(chǎng)景和需求。般來(lái)說(shuō),鋰離子超級(jí)電容器結(jié)合了鋰離子電池和超級(jí)電容器的優(yōu)點(diǎn),具有高能量密度和高功率密度的特點(diǎn),同時(shí)具備較長(zhǎng)
    的頭像 發(fā)表于 06-30 08:15 ?2051次閱讀
    鋰離子超級(jí)電容器跟超級(jí)電容器<b class='flag-5'>哪一種</b>更加好?

    信號(hào)調(diào)制的三種基本方法

    號(hào)調(diào)制的三種基本方法:調(diào)幅(AM)、調(diào)頻(FM)和調(diào)相(PM),并分析它們的優(yōu)缺點(diǎn)及應(yīng)用場(chǎng)景。 調(diào)幅(AM) 2.1 調(diào)幅原理 調(diào)幅(Amplitude Modulation,AM)是一種將低頻信號(hào)的幅度變化映射到高頻載波信號(hào)的
    的頭像 發(fā)表于 06-03 09:38 ?5236次閱讀