基于KL散度和近鄰點(diǎn)間距離的球面嵌入算法
針對現(xiàn)有球面嵌入算法在非近鄰點(diǎn)間的距離度量不準(zhǔn)確或缺失的情況下,不能有效地進(jìn)行低維嵌入的問題,提出了一種新的球面嵌入算法,它能夠只利用近鄰點(diǎn)間的距離,將任何尺度的高維數(shù)據(jù)嵌入到單位球面上,同時求出適合原始數(shù)據(jù)分布的球面半徑。該算法從一個隨機(jī)產(chǎn)生的球面分布開始,利用KL散度衡量每對近鄰點(diǎn)間的歸一化距離在原始空間和球面空間中的差異,并基于此差異構(gòu)建出目標(biāo)函數(shù),然后再用帶有動量的隨機(jī)梯度下降法,不斷優(yōu)化球面上點(diǎn)的分布,直到結(jié)果穩(wěn)定。為了測試算法,模擬產(chǎn)生了兩類球面分布數(shù)據(jù):分別是球面均勻分布和球面正態(tài)分布的數(shù)據(jù)。實(shí)驗(yàn)結(jié)果表明,對于球面均勻分布的數(shù)據(jù),即使在近鄰點(diǎn)個數(shù)很少的情況下,仍然能夠?qū)?shù)據(jù)準(zhǔn)確地嵌入球面空間,嵌入后的數(shù)據(jù)分布與原始數(shù)據(jù)分布的均方根誤差( RMSE)低于0.000 01,且球面半徑的估算誤差低于0. 000 001;而對于球面正態(tài)分布的數(shù)據(jù),在近鄰點(diǎn)個數(shù)較多的情況下,該算法也可以將數(shù)據(jù)較準(zhǔn)確地嵌入球面空間。因此,在非近鄰點(diǎn)間距離缺失的情況下,所提方法仍然可以較準(zhǔn)確地對數(shù)據(jù)進(jìn)行低維嵌入,這非常有利于數(shù)據(jù)的可視化研究。
非常好我支持^.^
(0) 0%
不好我反對
(0) 0%