0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

?特斯拉機(jī)器學(xué)習(xí)超級(jí)計(jì)算機(jī)DOJO支持靈活適應(yīng)新的算法和應(yīng)用

lPCU_elecfans ? 來(lái)源:電子發(fā)燒友網(wǎng) ? 作者:電子發(fā)燒友網(wǎng) ? 2022-08-25 15:21 ? 次閱讀

電子發(fā)燒友網(wǎng)報(bào)道(文/周凱揚(yáng))這年頭不少車(chē)企都開(kāi)始自主研發(fā)自動(dòng)駕駛系統(tǒng),連帶部署數(shù)據(jù)中心和超算已經(jīng)不是什么新鮮事了。除了特斯拉的DOJO和GPU超算以外,小鵬也在本月宣布與阿里云合作搭建了全國(guó)最大的自動(dòng)駕駛智算中心“扶搖”,算力可達(dá)600PFLOPS,看來(lái)新一輪的軍備競(jìng)賽很快就會(huì)拉開(kāi)帷幕。

對(duì)于自動(dòng)駕駛的開(kāi)發(fā)來(lái)說(shuō),模型訓(xùn)練至關(guān)重要,尋常的服務(wù)器CPU基本無(wú)法滿(mǎn)足這個(gè)負(fù)載需求,所以不少車(chē)企都在借助英偉達(dá)的GPU開(kāi)展訓(xùn)練,特斯拉也不例外。正巧今年的Hot Chips大會(huì)上安排了三場(chǎng)特斯拉的分享,都與特斯拉的AI與DOJO平臺(tái)有關(guān),特斯拉的幾位自動(dòng)駕駛與AI部門(mén)負(fù)責(zé)人也都透露了他們?cè)谲浻布系囊恍┻M(jìn)展,就當(dāng)是作為下個(gè)月底特斯拉AI日的前瞻了。

DOJO超算

特斯拉的DOJO是他們自研自用的機(jī)器學(xué)習(xí)超級(jí)計(jì)算機(jī),采用了高度可擴(kuò)展而且完全分布式的系統(tǒng),對(duì)神經(jīng)網(wǎng)絡(luò)訓(xùn)練負(fù)載進(jìn)行了專(zhuān)門(mén)的優(yōu)化,支持靈活適應(yīng)新的算法和應(yīng)用。根據(jù)特斯拉Autopilot硬件工程師Emil Talpes的說(shuō)法,DOJO從設(shè)計(jì)之初就是為了大型系統(tǒng)設(shè)計(jì)的,而不是基于目前已有的商用小系統(tǒng),再把規(guī)模做大。

DOJO的基礎(chǔ)組成部分,就是它的D1裸片。D1基于臺(tái)積電7nm工藝,單個(gè)裸片面積占645mm2。大家都知道蘋(píng)果M1 Ultra的die size相當(dāng)大,可哪怕是M1 Ultra的單個(gè)裸片大小也只有432mm2。D1采用了極度模塊化的設(shè)計(jì),每個(gè)D1上共有354個(gè)DOJO處理單元,而且以2D陣列的形式物理和邏輯排布,單個(gè)D1在2GHz下的算力可達(dá)362TFLOPS。

由5x5排布的25個(gè)合格D1芯片(KGD)組成了一個(gè)DOJO訓(xùn)練模塊,整個(gè)模塊從電、熱、機(jī)械結(jié)構(gòu)上都是完全集成在一起的,模塊水平層面負(fù)責(zé)不同模塊之間的通信,而垂直層面則解決15kW的供電和散熱問(wèn)題。

整個(gè)DOJO系統(tǒng)就是由DOJO訓(xùn)練模塊按2D網(wǎng)格結(jié)構(gòu)排列而成,網(wǎng)格邊緣配置了DOJO接口處理器(DIP)來(lái)提供共享內(nèi)存支持。而本屆Hot Chips上,特斯拉終于放出了這一處理器的詳細(xì)情報(bào)。

表面看上去,DIP像是一張PCIe卡,而它實(shí)際上使用的也確實(shí)是32GB/s的PCIe 4.0接口,配有32GB的HBM內(nèi)核,提供800GB/s的總內(nèi)存帶寬。但這PCIe 4.0的接口只是用于連接主機(jī),真正發(fā)揮其性能的是特斯拉自研的TTP協(xié)議接口,提供900GB/s的超大帶寬給訓(xùn)練模塊。

訓(xùn)練模塊的邊緣配置了5個(gè)DIP卡,如此一來(lái)每邊都提供了160GB的共享DRAM,并通過(guò)這5張卡實(shí)現(xiàn)4.5TB/s的最大帶寬。要想擴(kuò)展網(wǎng)絡(luò)通信的話(huà),比如SmartNIC交換機(jī),DIP也原生硬件支持標(biāo)準(zhǔn)以太網(wǎng)上的TTP通信,當(dāng)然了選擇這種通信方式的話(huà)帶寬也會(huì)降低至50GB/s,延遲也會(huì)增加。

整個(gè)系統(tǒng)即一個(gè)ExaPOD,由10個(gè)機(jī)柜,超過(guò)100萬(wàn)片D1 CPU組成,算力可達(dá)1.1EFLOPS。而這樣的算力為特斯拉帶來(lái)了前所未有的訓(xùn)練性能,尤其是在自動(dòng)標(biāo)注上。

被機(jī)器取代的人工標(biāo)注員

雖然是特斯拉本身的商用車(chē)走的純視覺(jué)方案,但特斯拉路測(cè)車(chē)隊(duì)并不局限于提供視頻片段,畢竟去年就有人發(fā)現(xiàn)特斯拉的路測(cè)車(chē)輛頂著激光雷達(dá)在收集數(shù)據(jù)。在特斯拉路測(cè)車(chē)隊(duì)提交的片段中,除了視頻數(shù)據(jù)以外,還有IMU、GPS和測(cè)距儀等傳感器給出的數(shù)據(jù)。

這些數(shù)據(jù)經(jīng)過(guò)離線(xiàn)神經(jīng)網(wǎng)絡(luò)后,根據(jù)汽車(chē)行駛軌跡進(jìn)行靜態(tài)世界重構(gòu),同時(shí)根據(jù)移動(dòng)物體和動(dòng)力學(xué)對(duì)物體進(jìn)行自動(dòng)標(biāo)注。特斯拉可以自行選擇需要進(jìn)行標(biāo)注的片段,比如查詢(xún)可視條件不佳下的最近車(chē)輛,系統(tǒng)會(huì)自動(dòng)返回這些片段然后進(jìn)行自動(dòng)標(biāo)注。再加上特斯拉的4D標(biāo)注,也就是在標(biāo)注一次后,同時(shí)標(biāo)注所有相機(jī)中的多幀畫(huà)面,極大地加快了標(biāo)注速度。根據(jù)特斯拉的說(shuō)法,他們可以在一周之內(nèi)收集并自動(dòng)標(biāo)注1萬(wàn)個(gè)片段。

這也就是特斯拉引入DOJO超算的原因,雖然標(biāo)注的工作量在不斷提升,但隨著機(jī)器學(xué)習(xí)硬件資源的增多,手動(dòng)標(biāo)注的占比越來(lái)越低,而自動(dòng)標(biāo)注開(kāi)始占據(jù)主導(dǎo),這或許才是為何特斯拉標(biāo)注團(tuán)隊(duì)開(kāi)始裁員的真相。

仍在繼續(xù)擴(kuò)大規(guī)模的GPU超算

DOJO作為一個(gè)純CPU的超算系統(tǒng),能做到以上已經(jīng)相當(dāng)厲害了,然而我們也不能忘記了特斯拉的另外兩臺(tái)GPU超算。早在2021年,特斯拉最新的一臺(tái)GPU超算規(guī)模就已經(jīng)達(dá)到了720個(gè)節(jié)點(diǎn),每個(gè)節(jié)點(diǎn)包含8塊英偉達(dá)A100 80GB GPU,整個(gè)系統(tǒng)的總GPU數(shù)達(dá)到了驚人的5760塊。

根據(jù)英偉達(dá)給出的數(shù)據(jù),每個(gè)A100的算力有312TFLOPS,這也就意味著這臺(tái)最新GPU超算的算力已經(jīng)超越了E級(jí),達(dá)到了可怕的1.8EFLOPS。不過(guò)這里的E級(jí)和我們平常說(shuō)的E級(jí)超算還是有區(qū)別的,TOP500的那些超算跑分用的是LINPACK HPL,用到的是64位雙精度的格式,得出的實(shí)際應(yīng)用性能。而英偉達(dá)的A100的312TFLOPS是基于16位半精度來(lái)算的,而且是峰值性能。

可即便如此,這臺(tái)超算的實(shí)力也能在TOP500上名列前茅,根據(jù)特斯拉前AI主管Andrej Karpathy的說(shuō)法,單論算力(峰值)的話(huà),特斯拉這臺(tái)GPU超算確實(shí)能在去年六月的超算榜上名列第五。

而近期,特斯拉負(fù)責(zé)AI基礎(chǔ)設(shè)施和AI平臺(tái)團(tuán)隊(duì)的工程經(jīng)理Tim Zaman宣布,特斯拉已經(jīng)將這臺(tái)超算的規(guī)模再度升級(jí),A100 80GB GPU的數(shù)量再度提升28%,達(dá)到了可怕的7360個(gè)。這價(jià)格十萬(wàn)左右的GPU一下就添置近2000個(gè),不得不承認(rèn)特斯拉確實(shí)愿意下血本。Tim Zaman表示哪怕單論GPU數(shù)量,這臺(tái)超算也能排名世界第七了。

至于峰值算力,這臺(tái)超算目前大概還是在第五的位置,這是因?yàn)榻衲甑那拔逑喑隽藘晌恍聲x選手,第一名的Frontier和第三名的LUMI都比這臺(tái)超算要強(qiáng)。而且特斯拉也并沒(méi)有提交LINPACK HPL的跑分結(jié)果,畢竟這套系統(tǒng)已經(jīng)投入使用,特斯拉作為商業(yè)公司,也沒(méi)必要去停止手頭的訓(xùn)練負(fù)載而追求跑分。DOJO的話(huà),特斯拉并沒(méi)有公開(kāi)升級(jí)其規(guī)模,上文中的1.1EFLOPS的峰值算力也是基于BF16的,所以也不適合拿來(lái)直接對(duì)比。

寫(xiě)在最后

電動(dòng)車(chē)時(shí)代的來(lái)臨給不少造車(chē)新勢(shì)力降低了門(mén)檻,然而自動(dòng)駕駛技術(shù)的存在又將整個(gè)門(mén)檻拉高了一大截。從目前頭部企業(yè)的動(dòng)向來(lái)看,搭建智算中心,拿高密度的計(jì)算資源去跑訓(xùn)練或許是唯一的自研路線(xiàn),這樣法規(guī)完善后,才能讓自動(dòng)駕駛汽車(chē)在全國(guó)范圍內(nèi)鋪開(kāi),自動(dòng)駕駛也不會(huì)局限于試點(diǎn)技術(shù)。

但是否摸清楚了技術(shù)路線(xiàn),是否愿意砸這個(gè)錢(qián),以及回報(bào)率高低才是他們邁出這一步關(guān)鍵,畢竟要讓一個(gè)車(chē)企去組建團(tuán)隊(duì)搞芯片設(shè)計(jì),這個(gè)要求還是有些過(guò)分了,但僅僅是與云服務(wù)廠商合作打造這樣一個(gè)智算中心,同樣也得付出不小的成本。

審核編輯:彭靜
聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:?特斯拉的自動(dòng)駕駛標(biāo)注員正在被DOJO超算取代

文章出處:【微信號(hào):elecfans,微信公眾號(hào):電子發(fā)燒友網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    云端超級(jí)計(jì)算機(jī)使用教程

    云端超級(jí)計(jì)算機(jī)是一種基于云計(jì)算的高性能計(jì)算服務(wù),它將大量計(jì)算資源和存儲(chǔ)資源集中在一起,通過(guò)網(wǎng)絡(luò)向用戶(hù)提供按需的
    的頭像 發(fā)表于 12-17 10:19 ?130次閱讀

    NVIDIA助力丹麥發(fā)布首臺(tái)AI超級(jí)計(jì)算機(jī)

    這臺(tái)丹麥最大的超級(jí)計(jì)算機(jī)由該國(guó)政府與丹麥 AI 創(chuàng)新中心共同建設(shè),是一臺(tái) NVIDIA DGX SuperPOD 超級(jí)計(jì)算機(jī)
    的頭像 發(fā)表于 10-27 09:42 ?449次閱讀

    云端超級(jí)計(jì)算機(jī)怎么用

    云端超級(jí)計(jì)算機(jī)是一種基于云計(jì)算的高性能計(jì)算服務(wù),它將大量計(jì)算資源和存儲(chǔ)資源集中在一起,通過(guò)網(wǎng)絡(luò)向用戶(hù)提供按需的
    的頭像 發(fā)表于 10-18 10:14 ?161次閱讀

    借助NVIDIA超級(jí)計(jì)算機(jī)加速量子計(jì)算發(fā)展

    科學(xué)期刊《自然》(Nature)本月早些時(shí)候發(fā)表了一項(xiàng)研究,通過(guò)使用 NVIDIA 驅(qū)動(dòng)的超級(jí)計(jì)算機(jī),驗(yàn)證了量子計(jì)算的商業(yè)化途徑。
    的頭像 發(fā)表于 07-25 09:55 ?525次閱讀

    計(jì)算機(jī)視覺(jué)技術(shù)的AI算法模型

    計(jì)算機(jī)視覺(jué)技術(shù)作為人工智能領(lǐng)域的一個(gè)重要分支,旨在使計(jì)算機(jī)能夠像人類(lèi)一樣理解和解釋圖像及視頻中的信息。為了實(shí)現(xiàn)這一目標(biāo),計(jì)算機(jī)視覺(jué)技術(shù)依賴(lài)于多種先進(jìn)的AI算法模型。以下將詳細(xì)介紹幾種常
    的頭像 發(fā)表于 07-24 12:46 ?885次閱讀

    計(jì)算機(jī)視覺(jué)和機(jī)器視覺(jué)區(qū)別在哪

    計(jì)算機(jī)視覺(jué)和機(jī)器視覺(jué)是兩個(gè)密切相關(guān)但又有明顯區(qū)別的領(lǐng)域。 一、定義 計(jì)算機(jī)視覺(jué) 計(jì)算機(jī)視覺(jué)是一門(mén)研究如何使計(jì)算機(jī)能夠像人類(lèi)一樣理解和解釋視覺(jué)
    的頭像 發(fā)表于 07-09 09:22 ?458次閱讀

    機(jī)器學(xué)習(xí)算法原理詳解

    機(jī)器學(xué)習(xí)作為人工智能的一個(gè)重要分支,其目標(biāo)是通過(guò)讓計(jì)算機(jī)自動(dòng)從數(shù)據(jù)中學(xué)習(xí)并改進(jìn)其性能,而無(wú)需進(jìn)行明確的編程。本文將深入解讀幾種常見(jiàn)的機(jī)器
    的頭像 發(fā)表于 07-02 11:25 ?1082次閱讀

    馬斯克計(jì)劃打造超級(jí)計(jì)算機(jī)推動(dòng)AI發(fā)展

    科技巨頭埃隆·馬斯克近日在投資者會(huì)議上透露,其人工智能初創(chuàng)公司xAI正全力籌備打造一臺(tái)超級(jí)計(jì)算機(jī)。這臺(tái)計(jì)算機(jī)將作為下一版人工智能聊天機(jī)器人Grok的強(qiáng)大后盾,為其提供強(qiáng)大的算力
    的頭像 發(fā)表于 05-28 09:18 ?542次閱讀

    富士通使用富岳超級(jí)計(jì)算機(jī)訓(xùn)練LLM

    盡管富士通的富岳超級(jí)計(jì)算機(jī)不再是超級(jí)計(jì)算機(jī)500強(qiáng)名單中最快的機(jī)器,但它仍然是一個(gè)非常強(qiáng)大的系統(tǒng),A64FX處理器的多功能性允許將其用于各種
    的頭像 發(fā)表于 05-13 14:18 ?556次閱讀

    諾和諾德基金會(huì)將聯(lián)手英偉達(dá)打造丹麥AI超級(jí)計(jì)算機(jī)

    丹麥打造一臺(tái)領(lǐng)先的AI超級(jí)計(jì)算機(jī)。這臺(tái)超級(jí)計(jì)算機(jī)將致力于推動(dòng)醫(yī)療保健、生命科學(xué)以及綠色轉(zhuǎn)型等領(lǐng)域的科研與創(chuàng)新,為丹麥乃至全球的研究人員提供強(qiáng)大的計(jì)算
    的頭像 發(fā)表于 03-21 13:43 ?611次閱讀

    計(jì)算機(jī)視覺(jué)的十大算法

    隨著科技的不斷發(fā)展,計(jì)算機(jī)視覺(jué)領(lǐng)域也取得了長(zhǎng)足的進(jìn)步。本文將介紹計(jì)算機(jī)視覺(jué)領(lǐng)域的十大算法,包括它們的基本原理、應(yīng)用場(chǎng)景和優(yōu)缺點(diǎn)。這些算法在圖像處理、目標(biāo)檢測(cè)、人臉識(shí)別等領(lǐng)域有著廣泛的應(yīng)
    的頭像 發(fā)表于 02-19 13:26 ?1247次閱讀
    <b class='flag-5'>計(jì)算機(jī)</b>視覺(jué)的十大<b class='flag-5'>算法</b>

    Tesla 計(jì)劃斥資 5 億美元建造一臺(tái)由 NVIDIA 的 AI GPU 提供支持Dojo 超級(jí)計(jì)算機(jī)

    ABSTRACT摘要Tesla計(jì)劃斥資5億美元建造一臺(tái)由NVIDIA的AIGPU提供支持Dojo超級(jí)計(jì)算機(jī),因此該公司正在加大基于AI的開(kāi)發(fā)力度。JAEALOT2024年1月27日T
    的頭像 發(fā)表于 02-19 12:45 ?569次閱讀
    Tesla 計(jì)劃斥資 5 億美元建造一臺(tái)由 NVIDIA 的 AI GPU 提供<b class='flag-5'>支持</b>的 <b class='flag-5'>Dojo</b> <b class='flag-5'>超級(jí)</b><b class='flag-5'>計(jì)算機(jī)</b>

    特斯拉將在紐約州打造Dojo超級(jí)計(jì)算機(jī)

    特斯拉近日宣布,將在美國(guó)紐約州布法羅市投資5億美元,建造一臺(tái)名為“Dojo”的超級(jí)計(jì)算機(jī)。這一決策源于紐約州穩(wěn)定的電力供應(yīng)、杰出的人才儲(chǔ)備以及滿(mǎn)足項(xiàng)目需求的充足空間。
    的頭像 發(fā)表于 02-01 10:32 ?674次閱讀

    特斯拉將斥資5億美元建造Dojo超級(jí)計(jì)算機(jī)

    據(jù)外媒報(bào)道,特斯拉將在其位于紐約布法羅的超級(jí)工廠投資超過(guò)5億美元,建造一臺(tái)名為Dojo超級(jí)計(jì)算機(jī)。這一舉措旨在推進(jìn)
    的頭像 發(fā)表于 01-29 11:26 ?710次閱讀

    特斯拉在布法羅超級(jí)工廠投資5億美元建造Dojo超級(jí)計(jì)算機(jī)

    霍楚爾表示,此次項(xiàng)目投資為5億美元,并將同時(shí)在紐約州立大學(xué)建設(shè)另一臺(tái)獨(dú)立的AI超級(jí)計(jì)算機(jī)。“我很榮幸地告訴大家,特斯拉將在布法羅投資5億美元,用于其新一代超級(jí)
    的頭像 發(fā)表于 01-29 10:58 ?412次閱讀