資料介紹
針對傳統(tǒng)的主動學習算法只能處理中小型數(shù)據(jù)集的問題,提出一種基于MapReduce的大數(shù)據(jù)主動學習算法。首先,在有類別標簽的初始訓練集上,用極限學習機( ELM)算法訓練一個分類器,并將其輸出用軟最大化函數(shù)變換為一個后驗概率分布。然后,將無類別標簽的大數(shù)據(jù)集劃分為Z個子集,并部署到Z個云計算節(jié)點上。在每一個節(jié)點,用訓練出的分類器并行地計算各個子集中樣例的信息熵,并選擇信息熵大的前q個樣例進行類別標注,將標注類別的Z×q個樣例添加到有類別標簽的訓練集中。重復以上步驟直到滿足預定義的停止條件。在Artificial、Skin、Statlog和Poker 4個數(shù)據(jù)集上與基于ELM的主動學習算法進行了比較,結果顯示,所提算法在4個數(shù)據(jù)集上均能完成主動樣例選擇,而基于ELM的主動學習算法只在規(guī)模最小的數(shù)據(jù)集上能完成主動樣例選擇。實驗結果表明,所提算法優(yōu)于基于極限學習機的主動學習算法。
大數(shù)據(jù)具有以下幾個特征:海量( Volume)、多模態(tài)(Variety)、變化速度快(Velocity)、蘊含價值高(Value)和可靠性高( Veracity)。在大數(shù)據(jù)環(huán)境下,傳統(tǒng)的機器學習面臨著巨大的挑戰(zhàn),其中也包括主動學習。主動學習算法大致可以分為兩大類:基于池的主動學習算法和基于流的主動學習算法。
- 大數(shù)據(jù)環(huán)境下的移動學習發(fā)展趨勢 21次下載
- 基于MapReduce的時間序列索引及數(shù)據(jù)查詢 7次下載
- 車聯(lián)網(wǎng)場景下汽車大數(shù)據(jù)應用模式綜述 13次下載
- 一種改進的主動標記分布學習算法 7次下載
- 一種改進的主動標記分布學習算法 7次下載
- 一種面向MapReduce的中間數(shù)據(jù)傳輸流水線優(yōu)化機制 4次下載
- 基于MapReduce和加權網(wǎng)絡信息熵的DBWGIE-MR算法 11次下載
- 基于MapReduce/Spark的大規(guī)模壓縮模糊K-近鄰算法 5次下載
- 大數(shù)據(jù)時代有什么樣的利與弊 11次下載
- 大數(shù)據(jù)環(huán)境下的移動學習發(fā)展是怎么樣的 0次下載
- 水文大數(shù)據(jù)標準化方法和水文大數(shù)據(jù)共享平臺關鍵技術的設計和資料概述 12次下載
- 如何使用Q學習算法進行X光主動視覺的安檢方法資料說明概述 2次下載
- 大數(shù)據(jù)的基礎起源發(fā)展和處理流程應用及面臨的挑戰(zhàn)和展望 12次下載
- 面向并行迭代的MapReduce模型 1次下載
- 基于PRank算法的主動排序學習算法
- 學習大數(shù)據(jù)前必須知道的知識 2638次閱讀
- 零基礎可以學習大數(shù)據(jù)開發(fā)嗎?學什么內(nèi)容? 3249次閱讀
- 大數(shù)據(jù)技術發(fā)展史簡介 淺談大數(shù)據(jù)挖掘與機器學習 7016次閱讀
- 大數(shù)據(jù)技術如何進行融合發(fā)展 9206次閱讀
- 視覺大數(shù)據(jù)領域的最好分析方法之一:深度學習 4843次閱讀
- 大數(shù)據(jù)是什么_大數(shù)據(jù)技術和應用的現(xiàn)狀與前景 2.3w次閱讀
- java工程師有必要轉(zhuǎn)做大數(shù)據(jù)嗎大數(shù)據(jù)學習路線你了解嗎 7518次閱讀
- 大數(shù)據(jù)產(chǎn)業(yè)生態(tài)聯(lián)盟的中國大數(shù)據(jù)產(chǎn)業(yè)發(fā)展白皮書 5418次閱讀
- 大數(shù)據(jù)分析到底需要多少種工具_大數(shù)據(jù)分析總結 1.1w次閱讀
- mapreduce二次排序_ mapreduce二次排序原理 6198次閱讀
- mapreduce的應用開發(fā)步驟 4748次閱讀
- 詳解MapReduce的模式、算法和用例 2369次閱讀
- mapreduce編程實例 1.1w次閱讀
- 什么是mapreduce_mapreduce工作原理_mapreduce_mapreduce邏輯模型圖 2.5w次閱讀
- 機器學習究竟如何促進大數(shù)據(jù)管理的革命以及解決問題而采取的行動 3248次閱讀
下載排行
本周
- 1電子電路原理第七版PDF電子教材免費下載
- 0.00 MB | 1490次下載 | 免費
- 2單片機典型實例介紹
- 18.19 MB | 92次下載 | 1 積分
- 3S7-200PLC編程實例詳細資料
- 1.17 MB | 27次下載 | 1 積分
- 4筆記本電腦主板的元件識別和講解說明
- 4.28 MB | 18次下載 | 4 積分
- 5開關電源原理及各功能電路詳解
- 0.38 MB | 10次下載 | 免費
- 6基于AT89C2051/4051單片機編程器的實驗
- 0.11 MB | 4次下載 | 免費
- 7藍牙設備在嵌入式領域的廣泛應用
- 0.63 MB | 3次下載 | 免費
- 89天練會電子電路識圖
- 5.91 MB | 3次下載 | 免費
本月
- 1OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234313次下載 | 免費
- 2PADS 9.0 2009最新版 -下載
- 0.00 MB | 66304次下載 | 免費
- 3protel99下載protel99軟件下載(中文版)
- 0.00 MB | 51209次下載 | 免費
- 4LabView 8.0 專業(yè)版下載 (3CD完整版)
- 0.00 MB | 51043次下載 | 免費
- 5555集成電路應用800例(新編版)
- 0.00 MB | 33562次下載 | 免費
- 6接口電路圖大全
- 未知 | 30320次下載 | 免費
- 7Multisim 10下載Multisim 10 中文版
- 0.00 MB | 28588次下載 | 免費
- 8開關電源設計實例指南
- 未知 | 21539次下載 | 免費
總榜
- 1matlab軟件下載入口
- 未知 | 935053次下載 | 免費
- 2protel99se軟件下載(可英文版轉(zhuǎn)中文版)
- 78.1 MB | 537791次下載 | 免費
- 3MATLAB 7.1 下載 (含軟件介紹)
- 未知 | 420026次下載 | 免費
- 4OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234313次下載 | 免費
- 5Altium DXP2002下載入口
- 未知 | 233045次下載 | 免費
- 6電路仿真軟件multisim 10.0免費下載
- 340992 | 191183次下載 | 免費
- 7十天學會AVR單片機與C語言視頻教程 下載
- 158M | 183277次下載 | 免費
- 8proe5.0野火版下載(中文版免費下載)
- 未知 | 138039次下載 | 免費
評論
查看更多