您好,歡迎來(lái)電子發(fā)燒友網(wǎng)! ,新用戶?[免費(fèi)注冊(cè)]

您的位置:電子發(fā)燒友網(wǎng)>源碼下載>數(shù)值算法/人工智能>

一種融合采樣技術(shù)和RE算法的微博轉(zhuǎn)發(fā)行為預(yù)測(cè)方法

大?。?/span>0.96 MB 人氣: 2018-01-07 需要積分:2

  針對(duì)微博轉(zhuǎn)發(fā)預(yù)測(cè)方法研究中的數(shù)據(jù)集不平衡問(wèn)題,提出了一種融合過(guò)采樣技術(shù)和隨機(jī)森林(RF算法的微博轉(zhuǎn)發(fā)行為預(yù)測(cè)方法。首先,定義了個(gè)體信息、社交關(guān)系和微博主題3類與微博轉(zhuǎn)發(fā)行為相關(guān)的特征,并基于信息增益算法實(shí)現(xiàn)了關(guān)鍵特征選?。黄浯?,綜合微博特征數(shù)據(jù)的特點(diǎn)來(lái)改進(jìn)少數(shù)類樣本合成過(guò)采樣技術(shù)( SMOTE),對(duì)原始數(shù)據(jù)集進(jìn)行非參數(shù)概率分布估計(jì),并根據(jù)近似概率分布對(duì)數(shù)據(jù)集進(jìn)行過(guò)采樣處理,從而使正反例數(shù)據(jù)量達(dá)到平衡;最后,利用隨機(jī)森林算法,依據(jù)微博轉(zhuǎn)發(fā)關(guān)鍵特征進(jìn)行分類器訓(xùn)練,并利用袋外(OOB)數(shù)據(jù)誤差估計(jì)來(lái)分析和設(shè)置隨機(jī)森林算法的相關(guān)參數(shù)。通過(guò)與基于決策樹(shù)(DT)、支持向量機(jī)(SVM)、樸素貝葉斯(NB)和隨機(jī)森林等算法的微博轉(zhuǎn)發(fā)預(yù)測(cè)方法進(jìn)行對(duì)比,所提方法整體性能優(yōu)于基準(zhǔn)方法中性能最優(yōu)的SVM方法,召回率提高了8%,F(xiàn)值提高了5%。實(shí)驗(yàn)結(jié)果表明,所提方法在實(shí)際應(yīng)用中能夠有效提高微博轉(zhuǎn)發(fā)行為預(yù)測(cè)的準(zhǔn)確率。

一種融合采樣技術(shù)和RE算法的微博轉(zhuǎn)發(fā)行為預(yù)測(cè)方法

非常好我支持^.^

(0) 0%

不好我反對(duì)

(0) 0%

      發(fā)表評(píng)論

      用戶評(píng)論
      評(píng)價(jià):好評(píng)中評(píng)差評(píng)

      發(fā)表評(píng)論,獲取積分! 請(qǐng)遵守相關(guān)規(guī)定!

      ?