一種統(tǒng)計屬性約簡的定義
大?。?/span>1.08 MB 人氣: 2017-12-25 需要積分:2
標簽:約簡算法(6850)
傳統(tǒng)的屬性約簡由于其時間復(fù)雜度和空間復(fù)雜度過高,幾乎無法應(yīng)用到大規(guī)模的數(shù)據(jù)集中.將隨機抽樣引入傳統(tǒng)的模糊粗糙集中,使得屬性約簡的效率大幅度提升.首先,在統(tǒng)計下近似的基礎(chǔ)上提出一種統(tǒng)計屬性約簡的定義.這里的約簡不是原有意義上的約簡。而是保持基于統(tǒng)計下近似定義的統(tǒng)計辨識度不變的屬性子集,然后。采用抽樣的方法計算統(tǒng)計辨識度的樣本估計值,基于此估計值可以對統(tǒng)計屬性重要性進行排序,從而可以設(shè)計一種快速的適用于大規(guī)模數(shù)據(jù)的序約簡算法.由于隨機抽樣集以及統(tǒng)計近似概念的引入,該算法從時間和空間上均降低了約簡的計算復(fù)雜度,同時又保持了數(shù)據(jù)集中信息含量幾乎不變.最后,數(shù)值實驗將基于隨機抽樣的序約簡算法和兩種傳統(tǒng)的屬性約簡算法從以下3個方面進行了對比:計算屬性約簡時間消耗、計算屬性約簡空間消耗、約簡效果.對比實驗驗證了基于隨機抽樣的序約簡算法在時間與空間上的優(yōu)勢.
?
非常好我支持^.^
(0) 0%
不好我反對
(0) 0%