0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

常見(jiàn)的幾種聚類(lèi)算法

倩倩 ? 來(lái)源:淮安海之聲旗艦店 ? 2020-04-15 15:23 ? 次閱讀

目前,聚類(lèi)算法被廣泛應(yīng)用于用戶畫(huà)像、廣告推薦、新聞推送和圖像分割等等。聚類(lèi)算法是機(jī)器學(xué)習(xí)中一種“數(shù)據(jù)探索”的分析方法,它幫助我們?cè)诖罅康臄?shù)據(jù)中探索和發(fā)現(xiàn)數(shù)據(jù)的結(jié)構(gòu)。那么機(jī)器學(xué)習(xí)中的聚類(lèi)算法有哪幾種呢?下面我將為大家一一介紹常見(jiàn)的幾種聚類(lèi)算法,分別是高斯聚類(lèi)模型、基于密度的聚類(lèi)算法、凝聚層次聚類(lèi)和均值漂移算法。

1、高斯聚類(lèi)模型

事實(shí)上,GMM 和 k-means 很像,不過(guò) GMM 是學(xué)習(xí)出一些概率密度函數(shù)來(lái),簡(jiǎn)單地說(shuō),k-means 的結(jié)果是每個(gè)數(shù)據(jù)點(diǎn)被 assign 到其中某一個(gè) cluster 了,而 GMM 則給出這些數(shù)據(jù)點(diǎn)被 assign 到每個(gè) cluster 的概率,又稱(chēng)作 soft assignment 。

2、基于密度的聚類(lèi)算法

基于密度的聚類(lèi)算法最大的優(yōu)點(diǎn)在于無(wú)需定義類(lèi)的數(shù)量,其次可以識(shí)別出局外點(diǎn)和噪聲點(diǎn)、并且可以對(duì)任意形狀的數(shù)據(jù)進(jìn)行聚類(lèi)。DBSCAN同樣是基于密度的聚類(lèi)算法,但其原理卻與均值漂移大不相同:首先從沒(méi)有被遍歷的任一點(diǎn)開(kāi)始,利用鄰域距離epsilon來(lái)獲取周?chē)c(diǎn);如果鄰域內(nèi)點(diǎn)的數(shù)量滿足閾值則此點(diǎn)成為核心點(diǎn)并以此開(kāi)始新一類(lèi)的聚類(lèi);其鄰域內(nèi)的所有點(diǎn)也屬于同一類(lèi),將所有的鄰域內(nèi)點(diǎn)以epsilon為半徑進(jìn)行步驟二的計(jì)算;重復(fù)步驟二、三直到變量完所有核心點(diǎn)的鄰域點(diǎn);此類(lèi)聚類(lèi)完成,同時(shí)又以任意未遍歷點(diǎn)開(kāi)始步驟一到四直到所有數(shù)據(jù)點(diǎn)都被處理;最終每個(gè)數(shù)據(jù)點(diǎn)都有自己的歸屬類(lèi)別或者屬于噪聲。

3、K均值聚類(lèi)

這一最著名的聚類(lèi)算法主要基于數(shù)據(jù)點(diǎn)之間的均值和與聚類(lèi)中心的聚類(lèi)迭代而成。它主要的優(yōu)點(diǎn)是十分的高效,由于只需要計(jì)算數(shù)據(jù)點(diǎn)與劇類(lèi)中心的距離,其計(jì)算復(fù)雜度只有O(n)。其工作原理主要分為以下四步:首先我們需要預(yù)先給定聚類(lèi)的數(shù)目同時(shí)隨機(jī)初始化聚類(lèi)中心。我們可以初略的觀察數(shù)據(jù)并給出較為準(zhǔn)確的聚類(lèi)數(shù)目;每一個(gè)數(shù)據(jù)點(diǎn)通過(guò)計(jì)算與聚類(lèi)中心的距離了來(lái)分類(lèi)到最鄰近的一類(lèi)中;根據(jù)分類(lèi)結(jié)果,利用分類(lèi)后的數(shù)據(jù)點(diǎn)重新計(jì)算聚類(lèi)中心;重復(fù)步驟二三直到聚類(lèi)中心不再變化。

4、凝聚層次聚類(lèi)

層次聚類(lèi)法主要有自頂向下和自底向上兩種方式。其中自底向上的方式,最初將每個(gè)點(diǎn)看作是獨(dú)立的類(lèi)別,隨后通過(guò)一步步的凝聚最后形成獨(dú)立的一大類(lèi),并包含所有的數(shù)據(jù)點(diǎn)。這會(huì)形成一個(gè)樹(shù)形結(jié)構(gòu),并在這一過(guò)程中形成聚類(lèi)。

5、均值漂移算法

這是一種基于滑動(dòng)窗口的均值算法,用于尋找數(shù)據(jù)點(diǎn)中密度最大的區(qū)域。其目標(biāo)是找出每一個(gè)類(lèi)的中心點(diǎn),并通過(guò)計(jì)算滑窗內(nèi)點(diǎn)的均值更新滑窗的中心點(diǎn)。最終消除臨近重復(fù)值的影響并形成中心點(diǎn),找到其對(duì)應(yīng)的類(lèi)別。其工作原理主要是以下幾點(diǎn):首先以隨機(jī)選取的點(diǎn)為圓心r為半徑做一個(gè)圓形的滑窗。其目標(biāo)是找出數(shù)據(jù)點(diǎn)中密度最高點(diǎn)并作為中心;在每個(gè)迭代后滑動(dòng)窗口的中心將為想著較高密度的方向移動(dòng);連續(xù)移動(dòng),直到任何方向的移動(dòng)都不能增加滑窗中點(diǎn)的數(shù)量,此時(shí)滑窗收斂;將上述步驟在多個(gè)滑窗上進(jìn)行以覆蓋所有的點(diǎn)。當(dāng)過(guò)個(gè)滑窗收斂重疊時(shí),其經(jīng)過(guò)的點(diǎn)將會(huì)通過(guò)其滑窗聚類(lèi)為一個(gè)類(lèi)。

以上就是機(jī)器學(xué)習(xí)中常見(jiàn)的五種聚類(lèi)算法,大家都了解了嗎?如果還想深入學(xué)習(xí)聚類(lèi)算法的相關(guān)內(nèi)容,比如原理、算法效果的衡量標(biāo)準(zhǔn)以及基于Kmeans算法進(jìn)行改進(jìn)的優(yōu)化方法,可以上博學(xué)谷官網(wǎng)進(jìn)行有關(guān)課程的在線學(xué)習(xí)。希望大家通過(guò)課程可以學(xué)會(huì)使用聚類(lèi)算法進(jìn)行數(shù)據(jù)分析,挖掘商業(yè)價(jià)值。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4624

    瀏覽量

    93110
  • 聚類(lèi)
    +關(guān)注

    關(guān)注

    0

    文章

    146

    瀏覽量

    14226
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8428

    瀏覽量

    132838
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    深入解析ECC256橢圓曲線加密算法

    保護(hù)數(shù)據(jù)不被非法人竊取、閱讀的目的。該過(guò)程的逆過(guò)程為解密,即將該編碼信息轉(zhuǎn)化為其原來(lái)數(shù)據(jù)的過(guò)程。1、常見(jiàn)加密算法常見(jiàn)加密算法可分為三類(lèi),對(duì)稱(chēng)
    的頭像 發(fā)表于 12-26 16:32 ?123次閱讀
    深入解析ECC256橢圓曲線加密<b class='flag-5'>算法</b>

    常見(jiàn)的加密算法有哪些?它們各自的優(yōu)勢(shì)是什么?

    常見(jiàn)的加密算法及其優(yōu)勢(shì)如下: AES(Advanced Encryption Standard): AES是一種對(duì)稱(chēng)加密算法,采用分組密碼體制,支持128位、192位和256位密鑰長(zhǎng)度。AES的優(yōu)勢(shì)
    的頭像 發(fā)表于 12-17 15:57 ?166次閱讀

    常見(jiàn)的lvs負(fù)載均衡算法

    常見(jiàn)的lvs負(fù)載均衡算法包括輪詢(xún)(RR)、加權(quán)輪詢(xún)(WRR)、最小連接(LC)、加權(quán)最小連接(WLC)、基于局部性的最少鏈接(LBLC)、帶復(fù)制的LBLC(LBLCR)、目標(biāo)地址散列(DH)、源地址
    的頭像 發(fā)表于 12-12 13:50 ?130次閱讀

    CAN總線十萬(wàn)個(gè)為什么 | 聊聊幾種常見(jiàn)的CAN網(wǎng)絡(luò)拓?fù)?/a>

    來(lái)到《CAN總線十萬(wàn)個(gè)為什么》系列視頻。今天我們聊聊幾種常見(jiàn)的CAN網(wǎng)絡(luò)拓?fù)?,主要有:線型拓?fù)?、星型拓?fù)洹h(huán)形拓?fù)浜蜆?shù)形拓?fù)洹?.線型拓?fù)渚€型拓?fù)?,也稱(chēng)為總線型拓?fù)洌?/div>
    的頭像 發(fā)表于 11-21 01:03 ?690次閱讀
    CAN總線十萬(wàn)個(gè)為什么 | 聊聊<b class='flag-5'>幾種</b><b class='flag-5'>常見(jiàn)</b>的CAN網(wǎng)絡(luò)拓?fù)? />    </a>
</div>                            <div   id=

    幾種常見(jiàn)的控制方法及其優(yōu)缺點(diǎn)

    。 溫度控制系統(tǒng)是變參數(shù)、有時(shí)滯和隨機(jī)干擾的動(dòng)態(tài)系統(tǒng),為達(dá)到滿意的控制效果,具有許多控制方法。故對(duì)幾種常見(jiàn)的控制方法及其優(yōu)缺點(diǎn)進(jìn)行了分析與比較。
    的頭像 發(fā)表于 11-09 09:57 ?1103次閱讀
    <b class='flag-5'>幾種</b><b class='flag-5'>常見(jiàn)</b>的控制方法及其優(yōu)缺點(diǎn)

    人員軌跡分析算法有哪些?

    時(shí)段等。這些信息可以對(duì)城市規(guī)劃、交通管理、公共安全等方面具有重要的指導(dǎo)意義。而為了實(shí)現(xiàn)人員軌跡分析,我們需要使用一些專(zhuān)門(mén)的算法和技術(shù)。 下面是幾種常用的人員軌跡分析算法: 1. 基于密度的
    的頭像 發(fā)表于 09-26 10:42 ?469次閱讀

    機(jī)器學(xué)習(xí)算法原理詳解

    機(jī)器學(xué)習(xí)作為人工智能的一個(gè)重要分支,其目標(biāo)是通過(guò)讓計(jì)算機(jī)自動(dòng)從數(shù)據(jù)中學(xué)習(xí)并改進(jìn)其性能,而無(wú)需進(jìn)行明確的編程。本文將深入解讀幾種常見(jiàn)的機(jī)器學(xué)習(xí)算法原理,包括線性回歸、邏輯回歸、支持向量機(jī)(SVM)、決策樹(shù)和K近鄰(KNN)
    的頭像 發(fā)表于 07-02 11:25 ?1211次閱讀

    A類(lèi)和B類(lèi)功放哪個(gè)更好

    在音頻放大領(lǐng)域,A類(lèi)(甲類(lèi))和B類(lèi)(乙類(lèi))功放作為兩種常見(jiàn)的放大技術(shù),各自具有獨(dú)特的優(yōu)勢(shì)和適用場(chǎng)景。本文旨在深入探討A類(lèi)和B類(lèi)功放的性能特點(diǎn)
    的頭像 發(fā)表于 05-31 18:11 ?5496次閱讀

    功率放大器的幾種常見(jiàn)類(lèi)型

    功率放大器,簡(jiǎn)稱(chēng)功放,是音響系統(tǒng)中的重要組成部分,其主要作用是將音頻信號(hào)放大,以驅(qū)動(dòng)揚(yáng)聲器發(fā)出更大的聲音。在音頻領(lǐng)域,功率放大器的種類(lèi)繁多,各具特色。本文將對(duì)功率放大器的幾種常見(jiàn)類(lèi)型進(jìn)行詳細(xì)介紹
    的頭像 發(fā)表于 05-23 16:03 ?3278次閱讀

    STM32單片機(jī)有哪幾種常見(jiàn)的開(kāi)發(fā)環(huán)境?

    STM32單片機(jī)是一款廣泛應(yīng)用于嵌入式系統(tǒng)開(kāi)發(fā)的單片機(jī),針對(duì)其開(kāi)發(fā),有以下幾種常見(jiàn)的方式:STM32單片機(jī)有哪幾種常見(jiàn)的開(kāi)發(fā)環(huán)境?KeilMDK是一款廣泛使用的單片機(jī)集成開(kāi)發(fā)環(huán)境,支持
    的頭像 發(fā)表于 05-18 08:04 ?3186次閱讀
    STM32單片機(jī)有哪<b class='flag-5'>幾種</b><b class='flag-5'>常見(jiàn)</b>的開(kāi)發(fā)環(huán)境?

    介紹幾種常見(jiàn)的e-PTFE防水透氣膜型號(hào)和規(guī)格

    大家好,我是微爾斯科技的VILI專(zhuān)注于高分子微孔材料的研發(fā)、應(yīng)用與推廣e-PTFE防水透氣膜是一種廣泛應(yīng)用于各種領(lǐng)域的高分子微孔材料,其型號(hào)和規(guī)格繁多,各具特色。下面,我們將詳細(xì)介紹幾種常見(jiàn)
    的頭像 發(fā)表于 05-07 08:08 ?1020次閱讀
    介紹<b class='flag-5'>幾種</b><b class='flag-5'>常見(jiàn)</b>的e-PTFE防水透氣膜型號(hào)和規(guī)格

    基于FPGA的常見(jiàn)的圖像算法模塊總結(jié)

    意在給大家補(bǔ)充一下基于FPGA的圖像算法基礎(chǔ),于是講解了一下常見(jiàn)的圖像算法模塊,經(jīng)過(guò)個(gè)人的總結(jié),將知識(shí)點(diǎn)分布如下所示。
    的頭像 發(fā)表于 04-28 11:45 ?628次閱讀
    基于FPGA的<b class='flag-5'>常見(jiàn)</b>的圖像<b class='flag-5'>算法</b>模塊總結(jié)

    聊一下常見(jiàn)幾種無(wú)線遙控器及其可能使用的晶振頻率

    無(wú)線遙控器可以分為四種類(lèi)型,其中每種類(lèi)型可能采用不同的頻率晶振。今天KOAN凱擎小妹聊一下常見(jiàn)幾種無(wú)線遙控器及其可能使用的晶振頻率。
    的頭像 發(fā)表于 03-22 14:29 ?5058次閱讀

    java實(shí)現(xiàn)多線程的幾種方式

    了多種實(shí)現(xiàn)多線程的方式,本文將詳細(xì)介紹以下幾種方式: 1.繼承Thread類(lèi) 2.實(shí)現(xiàn)Runnable接口 3.Callable和Future 4.線程池 5.Java 8中
    的頭像 發(fā)表于 03-14 16:55 ?765次閱讀

    浪涌保護(hù)器常見(jiàn)幾種抑制器件特點(diǎn)及應(yīng)用領(lǐng)域

    浪涌保護(hù)器常見(jiàn)幾種抑制器件特點(diǎn)及應(yīng)用領(lǐng)域? 浪涌保護(hù)器是一種用于保護(hù)電器設(shè)備免受過(guò)電壓和過(guò)電流的損害的裝置。而抑制器件是浪涌保護(hù)器的重要組成部分,用于抑制電壓和電流的浪涌。 下面將詳細(xì)介紹幾種
    的頭像 發(fā)表于 02-19 09:25 ?1005次閱讀