您好,歡迎來(lái)電子發(fā)燒友網(wǎng)! ,新用戶?[免費(fèi)注冊(cè)]

您的位置:電子發(fā)燒友網(wǎng)>源碼下載>數(shù)值算法/人工智能>

基于軟件錯(cuò)誤報(bào)告數(shù)據(jù)集成的改進(jìn)貝葉斯算法

大?。?/span>0.69 MB 人氣: 2017-12-18 需要積分:1

  用戶提交的軟件錯(cuò)誤報(bào)告隨意性大、主觀性強(qiáng)且內(nèi)容少導(dǎo)致自動(dòng)分類正確率不高,需要花費(fèi)大量人工干預(yù)時(shí)間。隨著互聯(lián)網(wǎng)的快速發(fā)展用戶提交的錯(cuò)誤報(bào)告數(shù)量也不斷增加,如何在海量數(shù)據(jù)下提高其自動(dòng)分類的精確度越來(lái)越受到關(guān)注。通過(guò)改進(jìn)詞頻一逆文檔頻率( TF-IDF),考慮到詞條在類間和類內(nèi)出現(xiàn)情況對(duì)文本分類的影響,提出一種基于軟件錯(cuò)誤報(bào)告數(shù)據(jù)集的改進(jìn)多項(xiàng)式樸素貝葉斯算法,同時(shí)在Hadoop平臺(tái)下使用MapReduce計(jì)算模型實(shí)現(xiàn)該算法的分布式版本。實(shí)驗(yàn)結(jié)果表明,改進(jìn)的多項(xiàng)式樸素貝葉斯算法將F1值提高到7l%,比原算法提高了27個(gè)百分點(diǎn),同時(shí)在海量數(shù)據(jù)下可以通過(guò)拓展節(jié)點(diǎn)的方式縮短運(yùn)行時(shí)間,有較好的執(zhí)行效率。

非常好我支持^.^

(0) 0%

不好我反對(duì)

(0) 0%

      發(fā)表評(píng)論

      用戶評(píng)論
      評(píng)價(jià):好評(píng)中評(píng)差評(píng)

      發(fā)表評(píng)論,獲取積分! 請(qǐng)遵守相關(guān)規(guī)定!

      ?