0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌大腦和DeepMind聯(lián)合發(fā)布堪稱AI界的MapReduce

中科院長(zhǎng)春光機(jī)所 ? 來(lái)源:新智元、reddit ? 作者:新智元、reddit ? 2021-06-26 15:32 ? 次閱讀

【新智元導(dǎo)讀】AI模型進(jìn)入大數(shù)據(jù)時(shí)代,單機(jī)早已不能滿足訓(xùn)練模型的要求,最近Google Brain和DeepMind聯(lián)手發(fā)布了一個(gè)可以分布式訓(xùn)練模型的框架Launchpad,堪稱AI界的MapReduce。

正如吳恩達(dá)所言,當(dāng)代機(jī)器學(xué)習(xí)算法的成功很大程度上是由于模型和數(shù)據(jù)集大小的增加,在大規(guī)模數(shù)據(jù)下進(jìn)行分布式訓(xùn)練也逐漸變得普遍,而如何在大規(guī)模數(shù)據(jù)、大模型的情況下進(jìn)行計(jì)算,還是一個(gè)挑戰(zhàn)。

分布式學(xué)習(xí)過(guò)程也會(huì)使實(shí)現(xiàn)過(guò)程復(fù)雜化,這對(duì)于許多不熟悉分布式系統(tǒng)機(jī)制的機(jī)器學(xué)習(xí)從業(yè)者來(lái)說(shuō)是個(gè)問(wèn)題,尤其是那些具有復(fù)雜通信拓?fù)浣Y(jié)構(gòu)的機(jī)器學(xué)習(xí)從業(yè)者。

在arxiv上一篇新論文中,來(lái)自 DeepMind 和 Google Brain 的研究團(tuán)隊(duì)用 Launchpad 解決了這個(gè)問(wèn)題,Launchpad 是一種編程模型,它簡(jiǎn)化了定義和啟動(dòng)分布式計(jì)算實(shí)例的過(guò)程。

論文的第一作者是來(lái)自DeepMind的華人Yang Fan,畢業(yè)于香港中文大學(xué)。

Launchpad 將分布式系統(tǒng)的拓?fù)涿枋鰹橐粋€(gè)圖形數(shù)據(jù)結(jié)構(gòu),這樣圖中的每個(gè)節(jié)點(diǎn)都代表一個(gè)服務(wù),即研究人員正在運(yùn)行的基本計(jì)算單元。

將句柄構(gòu)造為節(jié)點(diǎn)的引用,將客戶端表示為尚未構(gòu)造的服務(wù)。

圖的邊表示兩個(gè)服務(wù)之間的通信,并在構(gòu)建時(shí)將與一個(gè)節(jié)點(diǎn)相關(guān)聯(lián)的句柄給予另一個(gè)節(jié)點(diǎn)時(shí)創(chuàng)建。

通過(guò)這種方式,Launchpad 可以通過(guò)傳遞節(jié)點(diǎn)句柄來(lái)定義跨服務(wù)通信。Launchpad 的計(jì)算構(gòu)建塊由不同的服務(wù)類型表示,每種服務(wù)類型由特定于該類型的節(jié)點(diǎn)和句柄類表示。

論文中提出的 Launchpad 的生命周期可以分為三個(gè)階段: 設(shè)置、啟動(dòng)和執(zhí)行。設(shè)置階段構(gòu)造程序數(shù)據(jù)結(jié)構(gòu); 在啟動(dòng)階段,處理這個(gè)數(shù)據(jù)結(jié)構(gòu)以分配資源、地址等,并啟動(dòng)指定服務(wù); 然后執(zhí)行階段運(yùn)行服務(wù),例如為服務(wù)通信創(chuàng)建客戶端。

Launchpad 是用流行的編程語(yǔ)言 Python 實(shí)現(xiàn)的,它簡(jiǎn)化了定義程序和節(jié)點(diǎn)數(shù)據(jù)結(jié)構(gòu)以及為單個(gè)平臺(tái)啟動(dòng)的過(guò)程。Launchpad 框架還可以很容易地用任何其他宿主語(yǔ)言實(shí)現(xiàn),包括 c/c + + 等低級(jí)編程語(yǔ)言。

Launchpad 編程模型非常豐富,足以容納各種各樣的分布式系統(tǒng),包括參數(shù)服務(wù)器、 MapReduce和 Evolution Strategies。

研究人員用簡(jiǎn)潔的代碼詳細(xì)描述了如何將 Launchpad 應(yīng)用到這些常見(jiàn)的分布式系統(tǒng)范例中,并說(shuō)明了該框架在簡(jiǎn)化本研究領(lǐng)域常用機(jī)器學(xué)習(xí)算法和組件的設(shè)計(jì)過(guò)程方面的能力。

總的來(lái)說(shuō),Launchpad 是一個(gè)實(shí)用的、用戶友好的、表達(dá)性強(qiáng)的框架,用于機(jī)器學(xué)習(xí)研究人員和實(shí)踐者詳細(xì)說(shuō)明分布式系統(tǒng),作者表示,這個(gè)框架能夠處理日益復(fù)雜的機(jī)器學(xué)習(xí)模型。其他框架

2020年,DeepMind 發(fā)布過(guò)一個(gè)強(qiáng)化學(xué)習(xí)優(yōu)化框架Acme,可以讓AI驅(qū)動(dòng)的智能體在不同的執(zhí)行規(guī)模上運(yùn)行,從而簡(jiǎn)化強(qiáng)化學(xué)習(xí)算法的開(kāi)發(fā)過(guò)程。

強(qiáng)化學(xué)習(xí)可以讓智能體與環(huán)境互動(dòng),生成他們自己的訓(xùn)練數(shù)據(jù),這在電子游戲、機(jī)器人技術(shù)、自動(dòng)駕駛機(jī)器人出租車等領(lǐng)域取得了突破。

隨著所使用的訓(xùn)練數(shù)據(jù)量的增加,這促使設(shè)計(jì)了一個(gè)系統(tǒng),使智能體與環(huán)境實(shí)例相互作用,迅速積累經(jīng)驗(yàn)。DeepMind 斷言,將算法的單進(jìn)程原型擴(kuò)展到分布式系統(tǒng)通常需要重新實(shí)現(xiàn)相關(guān)的智能體,這就是 Acme 框架的用武之地。

DeepMind研究員寫(xiě)道,「Acme 是一個(gè)用于構(gòu)建可讀、高效、面向研究的 RL 算法的框架。Acme 的核心是設(shè)計(jì)用于簡(jiǎn)單描述 RL 智能體,這些智能體可以在不同規(guī)模的執(zhí)行中運(yùn)行,包括分布式智能體?!?/p>

Determined AI也是一個(gè)深度學(xué)習(xí)神器。Determined使深度學(xué)習(xí)工程師可以集中精力大規(guī)模構(gòu)建和訓(xùn)練模型,而無(wú)需擔(dān)心DevOps,或者為常見(jiàn)任務(wù)(如容錯(cuò)或?qū)嶒?yàn)跟蹤)編寫(xiě)代碼。更快的分布式訓(xùn)練,智能的超參優(yōu)化,實(shí)驗(yàn)跟蹤和可視化。

一萬(wàn)億模型要來(lái)了?谷歌大腦和DeepMind聯(lián)手發(fā)布分布式訓(xùn)練框架Launchpad

Determined主要運(yùn)用了Horovod,以Horovod為起點(diǎn),研究人員運(yùn)用了多年的專業(yè)知識(shí)和經(jīng)驗(yàn),使得整個(gè)訓(xùn)練過(guò)程比庫(kù)存配置要快得多。

Horovod 是一套面向TensorFlow 的分布式訓(xùn)練框架,由Uber 構(gòu)建并開(kāi)源,目前已經(jīng)運(yùn)行于Uber 的Michelangelo 機(jī)器學(xué)習(xí)即服務(wù)平臺(tái)上。Horovod 能夠簡(jiǎn)化并加速分布式深度學(xué)習(xí)項(xiàng)目的啟動(dòng)與運(yùn)行。當(dāng)數(shù)據(jù)較多或者模型較大時(shí),為提高機(jī)器學(xué)習(xí)模型訓(xùn)練效率,一般采用多 GPU 的分布式訓(xùn)練。TensorFlow 集群存在諸多缺點(diǎn),如概念太多、學(xué)習(xí)曲線陡峭、修改的代碼量大、性能損失較大等,而 Horovod 則讓深度學(xué)習(xí)變得更加美好,隨著規(guī)模增大,Horovod 性能基本是線性增加的,損失遠(yuǎn)小于 TensorFlow。

2019年,字節(jié)跳動(dòng)AI lab開(kāi)源了一款高性能分布式框架BytePS,在性能上顛覆了過(guò)去幾年allreduce流派一直占據(jù)上風(fēng)的局面,超出目前其他所有分布式訓(xùn)練框架一倍以上的性能,且同時(shí)能夠支持Tensorflow、PyTorch、MXNet等開(kāi)源庫(kù)。

BytePS 提供了 TensorFlow、PyTorch、 MXNet 以及Keras的插件,用戶只要在代碼中引用BytePS的插件,就可以獲得高性能的分布式訓(xùn)練。BytePS的核心邏輯,則實(shí)現(xiàn)在BytePS core里。具體的通信細(xì)節(jié),完全由BytePS完成,用戶完全不需要操心。

來(lái)源:reddit

責(zé)任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6177

    瀏覽量

    105696
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    31294

    瀏覽量

    269656
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8428

    瀏覽量

    132848

原文標(biāo)題:一萬(wàn)億模型要來(lái)了?谷歌大腦和DeepMind聯(lián)手發(fā)布分布式訓(xùn)練框架Launchpad

文章出處:【微信號(hào):cas-ciomp,微信公眾號(hào):中科院長(zhǎng)春光機(jī)所】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    谷歌加速AI部門(mén)整合:AI Studio團(tuán)隊(duì)并入DeepMind

    近日,谷歌正緊鑼密鼓地推進(jìn)其人工智能(AI)部門(mén)的整合工作。據(jù)谷歌AI Studio主管Logan Kilpatrick在領(lǐng)英頁(yè)面上的透露,谷歌
    的頭像 發(fā)表于 01-13 14:40 ?136次閱讀

    壁仞科技與軟通動(dòng)力聯(lián)合發(fā)布創(chuàng)新AI PC產(chǎn)品

    在廣州市黃埔區(qū)中新知識(shí)城舉辦的“H?I3 AI探索峰會(huì)”上,壁仞科技與軟通動(dòng)力攜手共創(chuàng)輝煌,聯(lián)合發(fā)布了全新的AI PC(AIPC)產(chǎn)品,這一里程碑式的合作標(biāo)志著AI技術(shù)在企業(yè)應(yīng)用領(lǐng)域的
    的頭像 發(fā)表于 09-02 16:07 ?486次閱讀

    谷歌任命原Character.AI首席執(zhí)行官為Gemini聯(lián)合技術(shù)負(fù)責(zé)人

    近日,谷歌宣布了一項(xiàng)重要人事任命,原Character.AI聯(lián)合創(chuàng)始人兼首席執(zhí)行官諾姆·沙澤爾(Noam Shazeer)已重返谷歌,并將擔(dān)任其人工智能新項(xiàng)目“Gemini”的
    的頭像 發(fā)表于 08-26 11:06 ?552次閱讀

    谷歌借助Gemini AI系統(tǒng)深化對(duì)機(jī)器人的訓(xùn)練

    7月12日,國(guó)際科技傳來(lái)新動(dòng)態(tài),谷歌正借助其先進(jìn)的Gemini AI系統(tǒng),深化對(duì)旗下機(jī)器人的訓(xùn)練,旨在顯著提升它們的導(dǎo)航能力和任務(wù)執(zhí)行能力。DeepMind機(jī)器人團(tuán)隊(duì)最新
    的頭像 發(fā)表于 07-12 16:29 ?655次閱讀

    谷歌發(fā)布多模態(tài)AI新品,加劇AI巨頭競(jìng)爭(zhēng)

    在全球AI競(jìng)技場(chǎng)上,谷歌與OpenAI一直穩(wěn)居領(lǐng)先地位。近日,谷歌在I/O開(kāi)發(fā)者大會(huì)上掀起了一股新的技術(shù)浪潮,發(fā)布了多款全新升級(jí)的多模態(tài)AI
    的頭像 發(fā)表于 05-16 09:28 ?462次閱讀

    谷歌DeepMind發(fā)布人工智能模型AlphaFold最新版本

    谷歌DeepMind近日發(fā)布了人工智能模型AlphaFold的最新版本——AlphaFold 3,這一革命性的工具將在藥物發(fā)現(xiàn)和疾病治療領(lǐng)域發(fā)揮巨大作用。
    的頭像 發(fā)表于 05-10 11:26 ?610次閱讀

    谷歌DeepMind推出新一代藥物研發(fā)AI模型AlphaFold 3

    谷歌DeepMind公司近日重磅推出了一款名為AlphaFold 3的全新藥物研發(fā)AI模型,這一創(chuàng)新技術(shù)將為科學(xué)家們提供前所未有的幫助,使他們能更精確地理解疾病機(jī)制,進(jìn)而開(kāi)發(fā)出更高效的治療藥物。
    的頭像 發(fā)表于 05-10 09:35 ?408次閱讀

    MediaTek攜手生態(tài)伙伴聯(lián)合發(fā)布《生成式AI手機(jī)產(chǎn)業(yè)白皮書(shū)》

    、騰訊混元、vivo等生態(tài)伙伴*,聯(lián)合發(fā)布《生成式AI手機(jī)產(chǎn)業(yè)白皮書(shū)》,共同定義了“生成式AI手機(jī)”的概念和典型特征。
    的頭像 發(fā)表于 05-08 16:48 ?465次閱讀

    芯馳科技與Qt Group聯(lián)合發(fā)布并展示了全新的智能座艙解決方案

    在2024年4月25日開(kāi)幕的北京國(guó)際汽車展上,芯馳科技與HMI開(kāi)發(fā)軟件提供商Qt Group聯(lián)合發(fā)布并展示了全新的智能座艙解決方案
    的頭像 發(fā)表于 04-29 14:23 ?1737次閱讀
    芯馳科技與Qt Group<b class='flag-5'>聯(lián)合發(fā)布</b>并展示了全新的智能座艙解決方案

    潤(rùn)和軟件與新財(cái)富聯(lián)合發(fā)布金融AI對(duì)話式搜索引擎“金融搜一搜”產(chǎn)品

    3月29日,新財(cái)富投顧嘉年華活動(dòng)中,江蘇潤(rùn)和軟件股份有限公司(以下簡(jiǎn)稱“潤(rùn)和軟件”)與深圳市新財(cái)富數(shù)字科技有限責(zé)任公司(以下簡(jiǎn)稱“新財(cái)富”)聯(lián)合發(fā)布了金融AI對(duì)話式搜索引擎——“金融搜一搜”產(chǎn)品,助力金融投資場(chǎng)景智能化升級(jí)。
    的頭像 發(fā)表于 04-02 10:15 ?523次閱讀
    潤(rùn)和軟件與新財(cái)富<b class='flag-5'>聯(lián)合發(fā)布</b>金融<b class='flag-5'>AI</b>對(duì)話式搜索引擎“金融搜一搜”產(chǎn)品

    谷歌DeepMind推出SIMI通用AI智能體

    近日,谷歌DeepMind團(tuán)隊(duì)發(fā)布了其最新研究成果——SIMI(Scalable Instructable Multiworld Agent),這是一個(gè)通用人工智能智能體,能夠在多種3D虛擬環(huán)境
    的頭像 發(fā)表于 03-18 11:39 ?1008次閱讀

    谷歌DeepMind推新AI模型Genie,能生成2D游戲平臺(tái)

    據(jù)報(bào)道,谷歌公司的DeepMind團(tuán)隊(duì)近期發(fā)布AI模型Genie,此模型擁有多達(dá)110億個(gè)參數(shù),能夠依據(jù)用戶提供的圖片及提示詞創(chuàng)建出相當(dāng)完整的2D游戲場(chǎng)景。
    的頭像 發(fā)表于 02-27 14:53 ?817次閱讀

    中國(guó)電信攜手中興通訊聯(lián)合發(fā)布Cluster DRS創(chuàng)新技術(shù)和成果

    2月26日,2024年世移動(dòng)通信大會(huì)(MWC2024)在西班牙巴塞羅那開(kāi)幕。展會(huì)期間,中國(guó)電信攜手中興通訊聯(lián)合發(fā)布了Cluster DRS(Dynamic Radio Sharing,基站簇級(jí)的動(dòng)態(tài)波束共享)創(chuàng)新技術(shù)和成果。
    的頭像 發(fā)表于 02-27 10:44 ?518次閱讀

    谷歌DeepMind資深AI研究員創(chuàng)辦AI Agent創(chuàng)企

    近日,剛從谷歌DeepMind離職的資深AI研究員Ioannis Antonoglou宣布創(chuàng)辦了一家名為“AI Agent”的創(chuàng)企。Ioannis Antonoglou常駐倫敦,此前曾
    的頭像 發(fā)表于 02-04 10:02 ?819次閱讀

    谷歌DeepMind科學(xué)家欲建AI初創(chuàng)公司

    據(jù)知情人士透露,谷歌人工智能部門(mén)DeepMind的兩名杰出科學(xué)家Laurent Sifre和Karl Tuyls正在與投資者商討在巴黎成立一家新的人工智能初創(chuàng)公司的事宜。
    的頭像 發(fā)表于 01-22 14:41 ?522次閱讀