基于層次劃分的密度優(yōu)化聚類算法
推薦 + 挑錯(cuò) + 收藏(0) + 用戶評(píng)論(0)
針對(duì)傳統(tǒng)的聚類算法對(duì)數(shù)據(jù)集反復(fù)聚類,且在大型數(shù)據(jù)集上計(jì)算效率欠佳的問題,提出一種基于層次劃分的最佳聚類數(shù)和初始聚類中心確定算法——基于層次劃分密度的聚類優(yōu)化( CODHD)。該算法基于層次劃分,對(duì)計(jì)算過程進(jìn)行研究,不需要對(duì)數(shù)據(jù)集進(jìn)行反復(fù)聚類。首先,掃描數(shù)據(jù)集獲得所有聚類特征的統(tǒng)計(jì)值;其次,自底向上地生成不同層次的數(shù)據(jù)劃分,計(jì)算每個(gè)劃分?jǐn)?shù)據(jù)點(diǎn)的密度,將最大密度點(diǎn)定為中心點(diǎn),計(jì)算中心點(diǎn)距離更高密度點(diǎn)的最小距離,以中心點(diǎn)密度與最小距離乘積之和的平均值為有效性指標(biāo),增量地構(gòu)建一條關(guān)于不同層次劃分的聚類質(zhì)量曲線;最后,根據(jù)曲線的極值點(diǎn)對(duì)應(yīng)的劃分估計(jì)最佳聚類數(shù)和初始聚類中心。實(shí)驗(yàn)結(jié)果表明,所提CODHD算法與預(yù)處理階段的聚類優(yōu)化( COPS)算法相比,聚類準(zhǔn)確度提高了30%,聚類算法效率至少提高14. 24%。所提算法具有較強(qiáng)的可行性和實(shí)用性。
非常好我支持^.^
(0) 0%
不好我反對(duì)
(0) 0%