您好,歡迎來(lái)電子發(fā)燒友網(wǎng)! ,新用戶?[免費(fèi)注冊(cè)]

您的位置:電子發(fā)燒友網(wǎng)>源碼下載>數(shù)值算法/人工智能>

基于本體約束的知識(shí)抽取方法

大小:0.83 MB 人氣: 2017-12-19 需要積分:3

  在信息抽取領(lǐng)域,命名實(shí)體識(shí)別方法可以為實(shí)體賦予正確的語(yǔ)義,實(shí)體關(guān)系抽取則可以明確兩個(gè)實(shí)體間的關(guān)系語(yǔ)義。但從知識(shí)的角度來(lái)看,無(wú)論是命名實(shí)體識(shí)別還是實(shí)體關(guān)系抽取都屬于“小粒度”限口識(shí)片段)的抽取,抽取結(jié)果并非獨(dú)立完整的知識(shí)實(shí)例。命名實(shí)體識(shí)別和實(shí)體關(guān)系抽取的成果只有經(jīng)過(guò)知識(shí)合成才能成為獨(dú)立完整的知識(shí)實(shí)例。但由于知識(shí)體系的復(fù)雜性和多樣性,合成“知識(shí)片段”往往是非常困難的。此外,傳統(tǒng)的信息抽取主要采用基于規(guī)則的方法,這種方法會(huì)導(dǎo)致在抽取信息時(shí)因無(wú)法克服不同的信息項(xiàng)滿足同一或具有包含關(guān)系抽取規(guī)則時(shí)無(wú)法確定信息項(xiàng)類型的問(wèn)題。

  本體是共享的、規(guī)范化的概念模型,是對(duì)某一領(lǐng)域中知識(shí)結(jié)構(gòu)的系統(tǒng)描述,因此從知識(shí)的角度來(lái)看,領(lǐng)域本體是知識(shí)抽取最有效的工具之一。但從目前來(lái)看,基于本體信息抽取和知識(shí)抽取的研究工作對(duì)領(lǐng)域本體的利用非常有限,且主要集中在一些信息本身格式和信息上下文格式的利用;而領(lǐng)域本體中蘊(yùn)含的邏輯知識(shí)以及推理能力很少被利用,因此這類方法在抽取結(jié)構(gòu)比較復(fù)雜的知識(shí)時(shí)抽取效果就明顯下降了。

  本文研究的思路是:將領(lǐng)域本體中蘊(yùn)含的邏輯知識(shí)轉(zhuǎn)換為一個(gè)Alloy語(yǔ)言表示的模型,在完成命名實(shí)體識(shí)別和實(shí)體關(guān)系抽取的基礎(chǔ)上,使用約束邏輯求解方法(Alloy分析器)來(lái)對(duì)領(lǐng)域內(nèi)的信息進(jìn)行更為精確的定位,最終得到一個(gè)具有明確語(yǔ)義的知識(shí)實(shí)例。本文的組織如下,第二節(jié)給出兩個(gè)引例,明確本文要解決的問(wèn)題;第三節(jié)介紹相關(guān)的概念;第四節(jié)是本文的重點(diǎn),介紹知識(shí)抽取的算法;第五節(jié)是實(shí)驗(yàn);最后是相關(guān)工作和結(jié)論。

基于本體約束的知識(shí)抽取方法

非常好我支持^.^

(0) 0%

不好我反對(duì)

(0) 0%

      發(fā)表評(píng)論

      用戶評(píng)論
      評(píng)價(jià):好評(píng)中評(píng)差評(píng)

      發(fā)表評(píng)論,獲取積分! 請(qǐng)遵守相關(guān)規(guī)定!

      ?