結(jié)合LSH的KNN數(shù)據(jù)填補(bǔ)算法
推薦 + 挑錯(cuò) + 收藏(0) + 用戶評(píng)論(0)
K近鄰(kNN)算法是缺失數(shù)據(jù)填補(bǔ)的常用算法,但由于需要逐個(gè)計(jì)算所有記錄對之間的相似度,因此其填補(bǔ)耗時(shí)較高。為提高算法效率,提出結(jié)合局部敏感哈希( LSH)的kNN數(shù)據(jù)填補(bǔ)算法LSH-kNN。首先,對不存在缺失的完整記錄進(jìn)行局部敏感哈希,為之后查找近似最近鄰提供索引;其次,針對枚舉型、數(shù)值型以及混合型缺失數(shù)據(jù)分別提出對應(yīng)的局部敏感哈希方法,對每一條待填補(bǔ)的不完整記錄進(jìn)行局部敏感哈希,按得到的哈希值找到與其疑似相似的候選記錄;最后在候選記錄中通過逐個(gè)計(jì)算相似度來找到其中相似程度最高的七條記錄,并按照kNN算法對不完整記錄進(jìn)行填補(bǔ)。通過在4個(gè)真實(shí)數(shù)據(jù)集上的實(shí)驗(yàn)表明,結(jié)合局部敏感哈希的kNN填補(bǔ)算法LSH-kNN相對經(jīng)典的kNN算法能夠顯著提高填補(bǔ)效率,并且保持準(zhǔn)確性基本不變。
非常好我支持^.^
(0) 0%
不好我反對
(0) 0%
下載地址
結(jié)合LSH的KNN數(shù)據(jù)填補(bǔ)算法下載
相關(guān)電子資料下載
- 應(yīng)用于MEMS執(zhí)行器的8英寸硅晶圓上的KNN無鉛技術(shù)介紹 345
- 基于STM32的解魔方機(jī)器人設(shè)計(jì)方案 578
- 機(jī)器學(xué)習(xí)技術(shù)之KNN近鄰算法編程實(shí)例 161
- KNN算法、分類回歸樹、隨機(jī)森林的優(yōu)缺點(diǎn)及應(yīng)用實(shí)例 4258
- 基于訓(xùn)練階段使用知識(shí)庫+KNN檢索相關(guān)信息輔助學(xué)習(xí)方法 1377
- 如何使用Arduino KNN庫進(jìn)行簡單的機(jī)器學(xué)習(xí)? 3316
- 數(shù)據(jù)科學(xué)經(jīng)典算法 KNN 已被嫌慢,ANN 比它快 380 倍 7141
- 詳解機(jī)器學(xué)習(xí)分類算法KNN 5844
- 從零開始學(xué)習(xí)機(jī)器學(xué)習(xí)最簡單的 KNN 算法 2521
- 帶你入門常見的機(jī)器學(xué)習(xí)分類算法——邏輯回歸、樸素貝葉斯、KNN、SVM、決策樹 9873