基于二次歸并的Deep Web實(shí)體匹配方法
推薦 + 挑錯(cuò) + 收藏(0) + 用戶評(píng)論(0)
針對(duì)權(quán)重邊剪枝( WEP)方法在準(zhǔn)確率和匹配效率等方面的不足,通過(guò)引入自匹配和歸并概念,提出一種基于二次歸并的Deep Web實(shí)體匹配方法。首先,提取各對(duì)象的屬性值,并按屬性值重組對(duì)象,使具有相同屬性值的對(duì)象聚集在一起,實(shí)現(xiàn)塊的有效劃分;其次,計(jì)算塊內(nèi)各對(duì)象間的匹配度,并據(jù)此進(jìn)行剪枝、自匹配檢測(cè)、歸并,輸出初步類簇;最后,以初步類簇為基礎(chǔ),利用簇內(nèi)對(duì)象間傳遞的消息以及對(duì)象屬性相似值,進(jìn)一步挖掘匹配關(guān)系,觸發(fā)新一輪的類簇歸并與更新。實(shí)驗(yàn)結(jié)果表明,與WEP方法相比,所提方法通過(guò)自匹配檢測(cè),自動(dòng)區(qū)分匹配關(guān)系并采取合適的匹配策略,使歸并過(guò)程逐漸精化,提高了匹配準(zhǔn)確率;通過(guò)分塊、剪枝,有效縮減了匹配空間,提高了系統(tǒng)運(yùn)行效率。
非常好我支持^.^
(0) 0%
不好我反對(duì)
(0) 0%