基于KL散度和近鄰點間距離的球面嵌入算法
針對現(xiàn)有球面嵌入算法在非近鄰點間的距離度量不準確或缺失的情況下,不能有效地進行低維嵌入的問題,提出了一種新的球面嵌入算法,它能夠只利用近鄰點間的距離,將任何尺度的高維數(shù)據(jù)嵌入到單位球面上,同時求出適合原始數(shù)據(jù)分布的球面半徑。該算法從一個隨機產生的球面分布開始,利用KL散度衡量每對近鄰點間的歸一化距離在原始空間和球面空間中的差異,并基于此差異構建出目標函數(shù),然后再用帶有動量的隨機梯度下降法,不斷優(yōu)化球面上點的分布,直到結果穩(wěn)定。為了測試算法,模擬產生了兩類球面分布數(shù)據(jù):分別是球面均勻分布和球面正態(tài)分布的數(shù)據(jù)。實驗結果表明,對于球面均勻分布的數(shù)據(jù),即使在近鄰點個數(shù)很少的情況下,仍然能夠將數(shù)據(jù)準確地嵌入球面空間,嵌入后的數(shù)據(jù)分布與原始數(shù)據(jù)分布的均方根誤差( RMSE)低于0.000 01,且球面半徑的估算誤差低于0. 000 001;而對于球面正態(tài)分布的數(shù)據(jù),在近鄰點個數(shù)較多的情況下,該算法也可以將數(shù)據(jù)較準確地嵌入球面空間。因此,在非近鄰點間距離缺失的情況下,所提方法仍然可以較準確地對數(shù)據(jù)進行低維嵌入,這非常有利于數(shù)據(jù)的可視化研究。
非常好我支持^.^
(0) 0%
不好我反對
(0) 0%