您好,歡迎來(lái)電子發(fā)燒友網(wǎng)! ,新用戶(hù)?[免費(fèi)注冊(cè)]

您的位置:電子發(fā)燒友網(wǎng)>源碼下載>數(shù)值算法/人工智能>

Spark環(huán)境結(jié)合MDBF的星型連接算法

大?。?/span>0.75 MB 人氣: 2017-12-23 需要積分:1

  為了適應(yīng)聯(lián)機(jī)分析處理( OLAP)系統(tǒng)中實(shí)時(shí)數(shù)據(jù)高性能分析需求不斷提高的需求,提出一種能夠適合Spark環(huán)境并結(jié)合多維Bloom Filter( MDBF)的星型連接算法SMDBFSJ。首先,根據(jù)多個(gè)維表構(gòu)建MDBF,利用其占用空間小的特點(diǎn),廣播到所有節(jié)點(diǎn);然后,在本地節(jié)點(diǎn)完成事實(shí)表過(guò)濾操作,事實(shí)表不需要在節(jié)點(diǎn)間移動(dòng)數(shù)據(jù);最后,過(guò)濾后的事實(shí)表與維表采用重劃分方式進(jìn)行連接,進(jìn)而得到最終結(jié)果。SMDBFSJ算法避免了事實(shí)表數(shù)據(jù)移動(dòng),通過(guò)MDBF減小了需要廣播的數(shù)據(jù)量,充分結(jié)合了廣播連接和重劃分連接的優(yōu)勢(shì)。實(shí)驗(yàn)結(jié)果表明了該算法的有效性,在單機(jī)和集群環(huán)境下,該算法相比重劃分連接均獲得了3倍左右的性能提升。

Spark環(huán)境結(jié)合MDBF的星型連接算法

非常好我支持^.^

(0) 0%

不好我反對(duì)

(0) 0%

      發(fā)表評(píng)論

      用戶(hù)評(píng)論
      評(píng)價(jià):好評(píng)中評(píng)差評(píng)

      發(fā)表評(píng)論,獲取積分! 請(qǐng)遵守相關(guān)規(guī)定!

      ?