您好,歡迎來電子發(fā)燒友網! ,新用戶?[免費注冊]

您的位置:電子發(fā)燒友網>源碼下載>數值算法/人工智能>

向量空間模型和算法步驟

大?。?/span>1.57 MB 人氣: 2017-11-10 需要積分:0

  隨著互聯(lián)網的迅速普及和發(fā)展,人們從萬維網上獲取信息的途徑和速度得到極大的拓展和提高,在獲得信息的同時,對信息處理也提出了相應的需求。目前,在信息的表示中,聲音、圖形、圖像、文本等類型眾多,但是文本仍然是這些類型中最主要的表示載體之一,在信息處理領域中,對于文本聚類、分類、查重等領域往往需要計算兩個文本之間的相似度,而且相似度計算往往是其他處理步驟的前提和基礎,相似度的計算往往決定著后續(xù)處理過程的準確性和有效性。

  文本相似度是衡量多個文本之間在表述內容方相似程度的一個具體數值,這個數值越大表明互相比較的兩個文本之間在內容方面交集越大,否則就表示相比較的文本之間在內容上相互交集的內容越少。相似度的計算目前已經應用到很多的領域,在機器翻譯領域需要通過文本相似度來選取平行語料、在信息檢索。領域需要通過文本相似度來擴展或者縮減檢索的范圍,從而獲得用戶最希望得到的結果,自動問答領域中往往需要問題自動分類以及答案聚類,這些都需要進行文本相似的計算,文本聚類和文本分類的核心問題就是將相似的對象歸為一類,所以文本相似度的計算是一個非常重要和非?;A而且關鍵的一個技術問題。
?

非常好我支持^.^

(0) 0%

不好我反對

(0) 0%

      發(fā)表評論

      用戶評論
      評價:好評中評差評

      發(fā)表評論,獲取積分! 請遵守相關規(guī)定!

      ?