矩陣弧微分的時間序列相似度量
將某一個統(tǒng)計指標(biāo)的各個數(shù)值按時間先后順序排列便構(gòu)成了時間序列。從金融領(lǐng)域到科學(xué)工程,從天文氣象到社會學(xué),時間序列無處不在。由于實際應(yīng)用中的時間序列往往具有高維、規(guī)模巨大、易受噪聲干擾等特點,直接在原始時間序列上進行數(shù)據(jù)分析、處理和挖掘變得非常困難,因此在對時間序列挖掘之前進行有效的預(yù)處理成為解決上述問題的關(guān)鍵。這其中時間序列特征表示和相似度量是預(yù)處理的關(guān)鍵。
相似度量是時間序列挖掘中一項重要的基礎(chǔ)任務(wù),主流的度量算法通常自定義一個距離函數(shù),選取的自變量為離散序列點坐標(biāo)及其變形,序列之間的距離越小則序列越相似。常見的算法有:歐氏距離( Euclidean Distance,ED),設(shè)定單一距離閾值,容易理解且算法簡單;動態(tài)時間規(guī)整( Dynamic Time Warping,DTW),借鑒語音數(shù)據(jù)處理的思路并運用動態(tài)規(guī)劃思想,通過彎曲時間軸來實現(xiàn)相似性度量;符號化距離,將時間序列預(yù)處理為字符串,利用查詢等概率劃分的正態(tài)分布完成相似度量;基于條件復(fù)雜性距離¨叫,嵌入信息論和計算理論,關(guān)注算法運行過程中的連接和壓縮操作,借助壓縮率來反映數(shù)據(jù)之間的相似性。
?
非常好我支持^.^
(0) 0%
不好我反對
(0) 0%