您好,歡迎來電子發(fā)燒友網(wǎng)! ,新用戶?[免費注冊]

您的位置:電子發(fā)燒友網(wǎng)>源碼下載>數(shù)值算法/人工智能>

一種非規(guī)范中文地址的行政區(qū)劃提取算法

大?。?/span>1.20 MB 人氣: 2017-12-05 需要積分:2

  由于互聯(lián)網(wǎng)上中文地址的非規(guī)范化表達(dá),導(dǎo)致互聯(lián)網(wǎng)中的中文地址信息在地理位置服務(wù)中難以直接應(yīng)用。針對此問題,提出一種非規(guī)范中文地址的行政區(qū)劃提取算法。首先,對原始數(shù)據(jù)進(jìn)行“路”特征詞分組預(yù)處理;再利用行政區(qū)劃字典和移動窗口最大匹配算法,從中文地址中提取所有可能的行政區(qū)劃數(shù)據(jù)集;然后,利用中文地址行政區(qū)劃元素之間具有層次關(guān)系的特點,建立行政區(qū)劃條件集合運(yùn)算規(guī)則,對獲取的數(shù)據(jù)集進(jìn)行集合運(yùn)算;再利用行政區(qū)劃匹配度建立一種行政區(qū)劃集合解析規(guī)則,來計算行政區(qū)劃可信度;最后,得到可信度最大信息量最完整的中文地址的行政區(qū)劃。利用從互聯(lián)網(wǎng)中提取的約25萬條中文地址數(shù)據(jù)進(jìn)行是否采用“路”特征詞分組處理以及是否進(jìn)行可信度計算處理,對算法的可用性進(jìn)行了驗證,并與目前的地址匹配技術(shù)進(jìn)行對比,準(zhǔn)確率達(dá)到93. 51%。

一種非規(guī)范中文地址的行政區(qū)劃提取算法

非常好我支持^.^

(0) 0%

不好我反對

(0) 0%

      發(fā)表評論

      用戶評論
      評價:好評中評差評

      發(fā)表評論,獲取積分! 請遵守相關(guān)規(guī)定!

      ?