基于Spark的ItemBased推薦算法性能優(yōu)化
推薦 + 挑錯(cuò) + 收藏(0) + 用戶(hù)評(píng)論(0)
MapReduce計(jì)算場(chǎng)景下,復(fù)雜的大數(shù)據(jù)挖掘類(lèi)算法通常需要多個(gè)MapReduce作業(yè)協(xié)作完成,但多個(gè)作業(yè)之間嚴(yán)重的冗余磁盤(pán)讀寫(xiě)及重復(fù)的資源申請(qǐng)操作,使得算法的性能?chē)?yán)重降低。為提高ItemBased推薦算法的計(jì)算效率,首先對(duì)MapReduce平臺(tái)下ItemBased協(xié)同過(guò)濾算法存在的性能問(wèn)題進(jìn)行了分析;在此基礎(chǔ)上利用Spark迭代計(jì)算及內(nèi)存計(jì)算上的優(yōu)勢(shì)提高算法的執(zhí)行效率,并實(shí)現(xiàn)了基于Spark平臺(tái)的ItemBased推薦算法。實(shí)驗(yàn)結(jié)果表明:當(dāng)集群節(jié)點(diǎn)規(guī)模分別為10與20時(shí),算法在Spark中的運(yùn)行時(shí)間分別只有MapReduce中的25.6%及30. 8%,Spark平臺(tái)下的算法相比MapReduce平臺(tái),執(zhí)行效率整體提高3倍以上。
?
非常好我支持^.^
(0) 0%
不好我反對(duì)
(0) 0%
下載地址
基于Spark的ItemBased推薦算法性能優(yōu)化下載
相關(guān)電子資料下載
- 天數(shù)智芯主導(dǎo)的DeepSpark開(kāi)源社區(qū)發(fā)布百大應(yīng)用開(kāi)放平臺(tái)24.06版本 436
- spark運(yùn)行的基本流程 91
- Spark基于DPU的Native引擎算子卸載方案 180
- 百度前高管景鯤與朱凱華創(chuàng)立AI搜索公司,Genspark產(chǎn)品驚艷上線 458
- 關(guān)于Spark的從0實(shí)現(xiàn)30s內(nèi)實(shí)時(shí)監(jiān)控指標(biāo)計(jì)算 111
- TikTok將開(kāi)發(fā)獨(dú)立版推薦算法,以滿足美國(guó)用戶(hù)需求? 426
- “Spark+Hive”在DPU環(huán)境下的性能測(cè)評(píng) | OLAP數(shù)據(jù)庫(kù)引擎選型白皮書(shū)(24版)DPU部分 212
- 芯科科技和Arduino合作創(chuàng)建SparkFun Thing Plus Matter板 234
- Sparkle撼與科技發(fā)布TBX-750FA-V2顯卡塢,支持3.5槽厚顯 243
- 如何注冊(cè)星閃Sparklink設(shè)備媒體接入層標(biāo)識(shí)、地址碼? 246