基于軟件錯(cuò)誤報(bào)告數(shù)據(jù)集成的改進(jìn)貝葉斯算法
推薦 + 挑錯(cuò) + 收藏(0) + 用戶評(píng)論(0)
用戶提交的軟件錯(cuò)誤報(bào)告隨意性大、主觀性強(qiáng)且內(nèi)容少導(dǎo)致自動(dòng)分類正確率不高,需要花費(fèi)大量人工干預(yù)時(shí)間。隨著互聯(lián)網(wǎng)的快速發(fā)展用戶提交的錯(cuò)誤報(bào)告數(shù)量也不斷增加,如何在海量數(shù)據(jù)下提高其自動(dòng)分類的精確度越來(lái)越受到關(guān)注。通過(guò)改進(jìn)詞頻一逆文檔頻率( TF-IDF),考慮到詞條在類間和類內(nèi)出現(xiàn)情況對(duì)文本分類的影響,提出一種基于軟件錯(cuò)誤報(bào)告數(shù)據(jù)集的改進(jìn)多項(xiàng)式樸素貝葉斯算法,同時(shí)在Hadoop平臺(tái)下使用MapReduce計(jì)算模型實(shí)現(xiàn)該算法的分布式版本。實(shí)驗(yàn)結(jié)果表明,改進(jìn)的多項(xiàng)式樸素貝葉斯算法將F1值提高到7l%,比原算法提高了27個(gè)百分點(diǎn),同時(shí)在海量數(shù)據(jù)下可以通過(guò)拓展節(jié)點(diǎn)的方式縮短運(yùn)行時(shí)間,有較好的執(zhí)行效率。
非常好我支持^.^
(0) 0%
不好我反對(duì)
(0) 0%
下載地址
基于軟件錯(cuò)誤報(bào)告數(shù)據(jù)集成的改進(jìn)貝葉斯算法下載
相關(guān)電子資料下載
- MES、ERP、PLM等工業(yè)系統(tǒng)的數(shù)據(jù)集成方案 143
- 首家!數(shù)勢(shì)科技通過(guò)中國(guó)信通院數(shù)據(jù)指標(biāo)管理平臺(tái)技術(shù)要求專項(xiàng)測(cè)試 308
- 什么數(shù)據(jù)集成(Data Integration):如何將業(yè)務(wù)數(shù)據(jù)集成到云平臺(tái)? 479
- WMS如何與SAP ERP集成,提升現(xiàn)代供應(yīng)鏈倉(cāng)儲(chǔ)管理效率? 341
- 面向多源數(shù)據(jù)集成的地下綜合管廊安全運(yùn)營(yíng)與智慧管控研究 215
- 什么是SNP SAP云端數(shù)據(jù)集成解決方案? 287
- SNP Glue新Saas技術(shù)在云數(shù)據(jù)集成中如何提升客戶價(jià)值 246
- 研華DataInsight數(shù)據(jù)集成與分析發(fā)展歷程 841
- IBM 將從 Software AG 收購(gòu) StreamSets 和 webMethods 平臺(tái) 657
- 工業(yè)物聯(lián)網(wǎng)設(shè)備管理平臺(tái)(IIOT數(shù)據(jù)集成平臺(tái))有什么功能? 402