基于卡方檢驗(yàn)與詞義分析的試題重復(fù)檢測(cè)算法
大?。?/span>1.29 MB 人氣: 2017-11-11 需要積分:0
推薦 + 挑錯(cuò) + 收藏(0) + 用戶評(píng)論(0)
標(biāo)簽:卡方檢驗(yàn)(1835)重復(fù)檢測(cè)(1608)
針對(duì)無紙化考試系統(tǒng)入庫(kù)試題重復(fù)檢測(cè)問題;提出基于卡方檢驗(yàn)與詞義分析的試題重復(fù)檢測(cè)算法,首先自動(dòng)提取試題的特征信息詞項(xiàng),利用卡方檢驗(yàn)改進(jìn)公式進(jìn)行特征詞分析并刪除冗余詞;其次,結(jié)合中文WordNet詞典對(duì)特征詞進(jìn)行詞義分析,并利用Tf-Idf方法計(jì)算入庫(kù)試題的特征詞向量與不同題型特征詞的余弦相似度;最后,根據(jù)所得相似度值判別該試題是否與題庫(kù)試題重復(fù)。實(shí)驗(yàn)結(jié)果表明,在重復(fù)度閥值選取0.8時(shí),算法耗時(shí)少、準(zhǔn)確性高。
?
非常好我支持^.^
(0) 0%
不好我反對(duì)
(0) 0%