您好,歡迎來電子發(fā)燒友網(wǎng)! ,新用戶?[免費注冊]

您的位置:電子發(fā)燒友網(wǎng)>源碼下載>數(shù)值算法/人工智能>

基于話題標簽和轉發(fā)的微博聚類和主題詞提取

大?。?/span>0.79 MB 人氣: 2017-12-23 需要積分:1

  針對微博聚類正確率不高的問題,在研究微博數(shù)據(jù)特點的基礎上,利用微博hashtag來增強向量空間模型,使用微博之間的轉發(fā)關系提升聚類的準確性,并利用微博的轉發(fā)、評論數(shù)以及微博發(fā)布者信息來提取聚類中的主題詞。在新浪微博數(shù)據(jù)集上進行實驗發(fā)現(xiàn),與k-means算法和基于加權語義和貝葉斯的中文短文本增量聚類算法(ICST-WSNB)相比,基于話題標簽和轉發(fā)關系的微博聚類算法的準確率比k-means算法提高了18.5%,比ICST-WSNB提高了6.48%,召回率以及F-值也有了一定的提高。實驗結果表明基于話題標簽和轉發(fā)關系的微博聚類算法能夠有效地提高微博聚類的正確率,進而獲取更加合適的主題詞。

非常好我支持^.^

(0) 0%

不好我反對

(0) 0%

      發(fā)表評論

      用戶評論
      評價:好評中評差評

      發(fā)表評論,獲取積分! 請遵守相關規(guī)定!

      ?