您好,歡迎來電子發(fā)燒友網(wǎng)! ,新用戶?[免費(fèi)注冊]

您的位置:電子發(fā)燒友網(wǎng)>源碼下載>數(shù)值算法/人工智能>

基于隱含狄列克雷分配LDA分類特征擴(kuò)展的廣告過濾方法

大?。?/span>0.82 MB 人氣: 2017-12-14 需要積分:1

  傳統(tǒng)的微博廣告過濾方法忽略了微博廣告文本的數(shù)據(jù)稀疏性、語義信息和廣告背景領(lǐng)域特征等因素的影響。針對這些問題,提出一種基于隱含狄列克雷分配( LDA)分類特征擴(kuò)展的廣告過濾方法。首先,將微博分為正常微博和廣告型微博,并分別構(gòu)建LDA主題模型預(yù)測短文本對應(yīng)的主題分布,將主題中的詞作為特征擴(kuò)展的基礎(chǔ);其次,在特征擴(kuò)展時結(jié)合文本類別信息提取背景領(lǐng)域特征,以降低其對文本分類的影響;最后,將擴(kuò)展后的特征向量作為分類器的輸入,根據(jù)支持向量機(jī)(SVM)的分類結(jié)果過濾廣告。實驗結(jié)果表明,與現(xiàn)有的僅基于短文本分類的過濾方法相比,其準(zhǔn)確率平均提升4個百分點(diǎn)。因此,該方法能有效擴(kuò)展文本特征,并降低背景領(lǐng)域特征的影響,更適用于數(shù)據(jù)量較大的微博廣告過濾。

非常好我支持^.^

(0) 0%

不好我反對

(0) 0%

      發(fā)表評論

      用戶評論
      評價:好評中評差評

      發(fā)表評論,獲取積分! 請遵守相關(guān)規(guī)定!

      ?