一種融合采樣技術(shù)和RE算法的微博轉(zhuǎn)發(fā)行為預(yù)測(cè)方法
推薦 + 挑錯(cuò) + 收藏(0) + 用戶評(píng)論(0)
針對(duì)微博轉(zhuǎn)發(fā)預(yù)測(cè)方法研究中的數(shù)據(jù)集不平衡問(wèn)題,提出了一種融合過(guò)采樣技術(shù)和隨機(jī)森林(RF)算法的微博轉(zhuǎn)發(fā)行為預(yù)測(cè)方法。首先,定義了個(gè)體信息、社交關(guān)系和微博主題3類與微博轉(zhuǎn)發(fā)行為相關(guān)的特征,并基于信息增益算法實(shí)現(xiàn)了關(guān)鍵特征選?。黄浯?,綜合微博特征數(shù)據(jù)的特點(diǎn)來(lái)改進(jìn)少數(shù)類樣本合成過(guò)采樣技術(shù)( SMOTE),對(duì)原始數(shù)據(jù)集進(jìn)行非參數(shù)概率分布估計(jì),并根據(jù)近似概率分布對(duì)數(shù)據(jù)集進(jìn)行過(guò)采樣處理,從而使正反例數(shù)據(jù)量達(dá)到平衡;最后,利用隨機(jī)森林算法,依據(jù)微博轉(zhuǎn)發(fā)關(guān)鍵特征進(jìn)行分類器訓(xùn)練,并利用袋外(OOB)數(shù)據(jù)誤差估計(jì)來(lái)分析和設(shè)置隨機(jī)森林算法的相關(guān)參數(shù)。通過(guò)與基于決策樹(shù)(DT)、支持向量機(jī)(SVM)、樸素貝葉斯(NB)和隨機(jī)森林等算法的微博轉(zhuǎn)發(fā)預(yù)測(cè)方法進(jìn)行對(duì)比,所提方法整體性能優(yōu)于基準(zhǔn)方法中性能最優(yōu)的SVM方法,召回率提高了8%,F(xiàn)值提高了5%。實(shí)驗(yàn)結(jié)果表明,所提方法在實(shí)際應(yīng)用中能夠有效提高微博轉(zhuǎn)發(fā)行為預(yù)測(cè)的準(zhǔn)確率。
非常好我支持^.^
(0) 0%
不好我反對(duì)
(0) 0%
下載地址
一種融合采樣技術(shù)和RE算法的微博轉(zhuǎn)發(fā)行為預(yù)測(cè)方法下載
相關(guān)電子資料下載
- 利用高頻采樣技術(shù)進(jìn)行高速差分阻抗測(cè)試方案 778
- 采樣技術(shù)對(duì)信噪比的提升方法 3535
- 什么是工業(yè)過(guò)程控制 2371
- 單片機(jī)片上的ADC如何利用過(guò)采樣技術(shù) 4094
- 對(duì)過(guò)采樣技術(shù)的理解與記憶 777
- 受制于汽車芯片短缺,豐田減產(chǎn)40%;Intel推出超采樣技術(shù),利好IoT市場(chǎng)…… 1551
- ADC中采樣技術(shù)的信號(hào)鏈設(shè)計(jì)挑戰(zhàn) 2741
- Switch Pro或?qū)⒅С諲VIDIA的DLSS深度學(xué)習(xí)超采樣技術(shù) 1505
- 消息稱Switch Pro將支持NVIDIA的DLSS深度學(xué)習(xí)超采樣技術(shù) 1673
- 三相交流標(biāo)準(zhǔn)源采用高精度采樣技術(shù),具備多種功能 650