基于Spark的矩陣分解并行化算法
大?。?/span>0.56 MB 人氣: 2018-01-02 需要積分:3
推薦 + 挑錯(cuò) + 收藏(0) + 用戶評(píng)論(0)
針對(duì)傳統(tǒng)矩陣分解算法在處理海量數(shù)據(jù)信息時(shí)所面臨的處理速度和計(jì)算資源的瓶頸問題,利用Spark在內(nèi)存計(jì)算和迭代計(jì)算上的優(yōu)勢(shì),提出了Spark框架下的矩陣分解并行化算法。首先,依據(jù)歷史數(shù)據(jù)矩陣初始化用戶因子矩陣和項(xiàng)目因子矩陣;其次,迭代更新因子矩陣,將迭代結(jié)果置于內(nèi)存中作為下次迭代的輸入;最后,迭代結(jié)束時(shí)得到矩陣推薦模型。通過在GroupLens網(wǎng)站上提供的MovieLens數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明,加速(Speedup)值達(dá)到了線性的結(jié)果,該算法可以提高協(xié)同過濾推薦算法在大數(shù)據(jù)規(guī)模下的執(zhí)行效率。
非常好我支持^.^
(0) 0%
不好我反對(duì)
(0) 0%
下載地址
基于Spark的矩陣分解并行化算法下載
相關(guān)電子資料下載
- 天數(shù)智芯主導(dǎo)的DeepSpark開源社區(qū)發(fā)布百大應(yīng)用開放平臺(tái)24.06版本 436
- spark運(yùn)行的基本流程 91
- Spark基于DPU的Native引擎算子卸載方案 180
- 百度前高管景鯤與朱凱華創(chuàng)立AI搜索公司,Genspark產(chǎn)品驚艷上線 458
- 關(guān)于Spark的從0實(shí)現(xiàn)30s內(nèi)實(shí)時(shí)監(jiān)控指標(biāo)計(jì)算 111
- “Spark+Hive”在DPU環(huán)境下的性能測(cè)評(píng) | OLAP數(shù)據(jù)庫引擎選型白皮書(24版)DPU部分 212
- 芯科科技和Arduino合作創(chuàng)建SparkFun Thing Plus Matter板 234
- Sparkle撼與科技發(fā)布TBX-750FA-V2顯卡塢,支持3.5槽厚顯 243
- 如何注冊(cè)星閃Sparklink設(shè)備媒體接入層標(biāo)識(shí)、地址碼? 246
- 如何利用DPU加速Spark大數(shù)據(jù)處理? | 總結(jié)篇 661