資料介紹
針對(duì)現(xiàn)有Eclat算法中普遍存在的候選集規(guī)模大、求交效率低的問(wèn)題,提出了基于剪枝優(yōu)化和索引求交的改進(jìn)Eclat算法。首先根據(jù)頻繁集的性質(zhì)采用預(yù)剪枝和后剪枝相結(jié)合的候選集優(yōu)化策略,即利用預(yù)剪枝技術(shù)裁剪待連接的項(xiàng)集數(shù)量以減少項(xiàng)集連接操作,同時(shí)利用先驗(yàn)性質(zhì)對(duì)連接后的項(xiàng)集進(jìn)行后剪枝處理;接著提出了一種基于事務(wù)索引的布爾數(shù)組求交方法,即通過(guò)將事務(wù)標(biāo)識(shí)作為索引來(lái)設(shè)置并檢索布爾數(shù)組,以獲得項(xiàng)集支持度計(jì)數(shù);最后通過(guò)設(shè)計(jì)對(duì)比實(shí)驗(yàn),在經(jīng)典數(shù)據(jù)集上測(cè)試該方法的有效性。實(shí)驗(yàn)表明,通過(guò)該方法能夠有效壓縮候選集規(guī)模,改善求交計(jì)算效率,特別是在支持度閾值小、事務(wù)數(shù)規(guī)模大的情況下,算法的運(yùn)行效率得到了明顯的提升。
現(xiàn)如今,通過(guò)使用數(shù)據(jù)挖掘技術(shù),我們可以從海量數(shù)據(jù)中挖掘有趣的信息。其中,關(guān)聯(lián)規(guī)則挖掘是數(shù)據(jù)挖掘技術(shù)中較為重要的一種手段。它一般分為兩個(gè)步驟:一是依據(jù)事先設(shè)定的支持度閾值找出所有符合條件的頻繁項(xiàng)集;二是依據(jù)頻繁項(xiàng)集及給定的置信度閾值產(chǎn)生關(guān)聯(lián)規(guī)則。其中,挖掘算法的性能主要取決于頻繁項(xiàng)集的生成,因此識(shí)別或發(fā)現(xiàn)所有頻繁項(xiàng)目集是關(guān)聯(lián)規(guī)則挖掘算法的核心。隨著數(shù)據(jù)挖掘技術(shù)理論研究的深入,各類關(guān)聯(lián)規(guī)則挖掘算法也在不斷地涌現(xiàn)。傳統(tǒng)的算法主要包括Apriori算法、FP-growth 算法以及Eclat 算法,后續(xù)的大部分算法都是在這三類算法的基礎(chǔ)上進(jìn)行相應(yīng)的優(yōu)化和改進(jìn)。
Apriori 算法使用一種稱為逐層搜索的迭代方法,通過(guò)項(xiàng)目集元素?cái)?shù)目的不斷增長(zhǎng)來(lái)逐步完成頻繁項(xiàng)集的發(fā)現(xiàn),核心思想是通過(guò)候選集生成和情節(jié)的向下封閉檢測(cè)兩個(gè)階段來(lái)挖掘頻繁項(xiàng)集,該算法設(shè)計(jì)思想簡(jiǎn)單,易于實(shí)現(xiàn),但是產(chǎn)生了大量候選集,同時(shí)需要多次對(duì)事務(wù)庫(kù)進(jìn)行掃描,計(jì)算耗時(shí)過(guò)長(zhǎng);FP-growth 算法使用一種稱為頻繁模式增長(zhǎng)的方法,采取分治策略,將代表頻繁項(xiàng)集的數(shù)據(jù)庫(kù)壓縮到一棵頻繁模式樹(shù)(FP 樹(shù))上,然后把這種壓縮后的數(shù)據(jù)庫(kù)劃分成條件數(shù)據(jù)庫(kù),每個(gè)數(shù)據(jù)庫(kù)關(guān)聯(lián)一個(gè)頻繁項(xiàng)或“模式段”,并分別挖掘每個(gè)條件數(shù)據(jù)庫(kù),這種方法可以顯著地壓縮被搜索的數(shù)據(jù)集的大小,該算法只掃描事務(wù)庫(kù)兩次,且無(wú)需產(chǎn)生候選集,相比Apriori 算法性能有顯著的提高,但由于所有項(xiàng)集都?jí)嚎s在一棵樹(shù)上,對(duì)內(nèi)存要求較高,且遞歸算法設(shè)計(jì)復(fù)雜;Eclat 算法[4]的核心思想是將水平數(shù)據(jù)庫(kù)轉(zhuǎn)換成垂直數(shù)據(jù)庫(kù),然后將項(xiàng)集的TID_set 進(jìn)行交運(yùn)算來(lái)得到項(xiàng)集的支持度,該算法由于只掃描一次事務(wù)庫(kù),且項(xiàng)集支持度是通過(guò)交運(yùn)算得到的,大大減少了計(jì)算時(shí)間,但Eclat 算法存在搜索空間大、連接操作頻繁、求交運(yùn)算耗時(shí)的問(wèn)題。
本文選取上述幾類算法中性能較好的Eclat 算法,結(jié)合近年來(lái)該算法的相關(guān)研究,針對(duì)其普遍存在的問(wèn)題和不足,從候選集的生成和支持度的計(jì)算兩個(gè)方面對(duì)其加以優(yōu)化和改進(jìn),提出了前后剪枝相結(jié)合的候選集優(yōu)化策略以及利用數(shù)組索引取值計(jì)數(shù)的求交運(yùn)算方法,以達(dá)到提高Eclat 算法效率的目的。
- 基于改進(jìn)郊狼優(yōu)化算法的淺層神經(jīng)網(wǎng)絡(luò)進(jìn)化 15次下載
- 基于ReliefF剪枝的多標(biāo)記分類算法綜述 12次下載
- 改進(jìn)鯨魚優(yōu)化算法在路徑規(guī)劃的應(yīng)用綜述 15次下載
- 改進(jìn)膠囊網(wǎng)絡(luò)優(yōu)化分成卷積的亞健康識(shí)別 7次下載
- 可提升全局尋優(yōu)精度的改進(jìn)灰狼優(yōu)化算法 6次下載
- 基于改進(jìn)自適應(yīng)權(quán)重的立體匹配優(yōu)化算法 3次下載
- 基于改進(jìn)的蝗蟲優(yōu)化算法的LSTM預(yù)測(cè)方法 7次下載
- 一種改進(jìn)的聚類聯(lián)合相似度推薦算法 10次下載
- 一種改進(jìn)的花朵授粉算法的WEB服務(wù)組合優(yōu)化 7次下載
- 一種改進(jìn)的哈里斯鷹優(yōu)化定位算法 6次下載
- 嵌入式設(shè)備的YOLO網(wǎng)絡(luò)剪枝算法 4次下載
- 基于深度神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)化剪枝算法 2次下載
- 關(guān)于蟻群算法的改進(jìn)優(yōu)化(源程序)資料下載 5次下載
- 一種改進(jìn)的神經(jīng)網(wǎng)絡(luò)相關(guān)性剪枝算法 0次下載
- 基于平均單元格的三角網(wǎng)格曲面快速求交算法
- 谷歌搜索引擎優(yōu)化的各個(gè)方面和步驟 695次閱讀
- Mysql索引是什么東西?索引有哪些特性?索引是如何工作的? 942次閱讀
- 邊緣計(jì)算計(jì)算卸載與資源分配聯(lián)合優(yōu)化算法 1033次閱讀
- 如何對(duì)spmv算法進(jìn)行優(yōu)化 1063次閱讀
- 基于改進(jìn)FCOS的鋼帶表面缺陷檢測(cè)算法 1394次閱讀
- 用于實(shí)現(xiàn)并行處理加速硬件的H.264算法的改進(jìn)和優(yōu)化 2149次閱讀
- 大數(shù)據(jù)是如何優(yōu)化企業(yè)搜索引擎 2167次閱讀
- 什么是決策樹(shù)?決策樹(shù)算法思考總結(jié) 1.1w次閱讀
- 基于動(dòng)態(tài)矩陣方法改進(jìn)了傳統(tǒng)CACC模型預(yù)測(cè)控制算法 6406次閱讀
- 數(shù)據(jù)集,網(wǎng)絡(luò)架構(gòu)和剪枝方法 5827次閱讀
- 數(shù)據(jù)挖掘算法:決策樹(shù)算法如何學(xué)習(xí)及分裂剪枝 5629次閱讀
- K-means的優(yōu)缺點(diǎn)及改進(jìn) 3.1w次閱讀
- 關(guān)聯(lián)規(guī)則挖掘——Apriori算法的基本原理以及改進(jìn) 9325次閱讀
- 配電網(wǎng)絡(luò)重構(gòu)的改進(jìn)混合遺傳算法 1128次閱讀
- 基于改進(jìn)模擬退火算法的電網(wǎng)無(wú)功優(yōu)化 769次閱讀
下載排行
本周
- 1TC358743XBG評(píng)估板參考手冊(cè)
- 1.36 MB | 330次下載 | 免費(fèi)
- 2開(kāi)關(guān)電源基礎(chǔ)知識(shí)
- 5.73 MB | 11次下載 | 免費(fèi)
- 3嵌入式linux-聊天程序設(shè)計(jì)
- 0.60 MB | 3次下載 | 免費(fèi)
- 4DIY動(dòng)手組裝LED電子顯示屏
- 0.98 MB | 3次下載 | 免費(fèi)
- 5基于FPGA的C8051F單片機(jī)開(kāi)發(fā)板設(shè)計(jì)
- 0.70 MB | 2次下載 | 免費(fèi)
- 651單片機(jī)窗簾控制器仿真程序
- 1.93 MB | 2次下載 | 免費(fèi)
- 751單片機(jī)大棚環(huán)境控制器仿真程序
- 1.10 MB | 2次下載 | 免費(fèi)
- 8基于51單片機(jī)的RGB調(diào)色燈程序仿真
- 0.86 MB | 2次下載 | 免費(fèi)
本月
- 1OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234315次下載 | 免費(fèi)
- 2555集成電路應(yīng)用800例(新編版)
- 0.00 MB | 33566次下載 | 免費(fèi)
- 3接口電路圖大全
- 未知 | 30323次下載 | 免費(fèi)
- 4開(kāi)關(guān)電源設(shè)計(jì)實(shí)例指南
- 未知 | 21549次下載 | 免費(fèi)
- 5電氣工程師手冊(cè)免費(fèi)下載(新編第二版pdf電子書)
- 0.00 MB | 15349次下載 | 免費(fèi)
- 6數(shù)字電路基礎(chǔ)pdf(下載)
- 未知 | 13750次下載 | 免費(fèi)
- 7電子制作實(shí)例集錦 下載
- 未知 | 8113次下載 | 免費(fèi)
- 8《LED驅(qū)動(dòng)電路設(shè)計(jì)》 溫德?tīng)栔?/a>
- 0.00 MB | 6656次下載 | 免費(fèi)
總榜
- 1matlab軟件下載入口
- 未知 | 935054次下載 | 免費(fèi)
- 2protel99se軟件下載(可英文版轉(zhuǎn)中文版)
- 78.1 MB | 537798次下載 | 免費(fèi)
- 3MATLAB 7.1 下載 (含軟件介紹)
- 未知 | 420027次下載 | 免費(fèi)
- 4OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234315次下載 | 免費(fèi)
- 5Altium DXP2002下載入口
- 未知 | 233046次下載 | 免費(fèi)
- 6電路仿真軟件multisim 10.0免費(fèi)下載
- 340992 | 191186次下載 | 免費(fèi)
- 7十天學(xué)會(huì)AVR單片機(jī)與C語(yǔ)言視頻教程 下載
- 158M | 183279次下載 | 免費(fèi)
- 8proe5.0野火版下載(中文版免費(fèi)下載)
- 未知 | 138040次下載 | 免費(fèi)
評(píng)論
查看更多