不久之前,Meta公開了他們在自研芯片上的進展,包括其第一代AI加速器MTIA,以及用于視頻轉碼的MSVP。作為有些“下坡路”傾向的互聯(lián)網大廠,Meta依然選擇自研硬件和芯片,可見Meta對AI的重視。
自研AI加速器MTIA
Meta過去的服務器架構主要依靠CPU來運行AI負載,但隨著AI模型對算力和內存的要求不斷提高,致使其不得不開始轉向特化的方案,比如GPU和NNPI之類的其他硬件加速器。可由于高性能GPU的成本持續(xù)走高,Meta很快就轉向了自研ASIC方案。
其實早在2020年,他們就設計了第一代的MTIA ASIC,不過當時僅僅只是用于MTIA的部分內部工作負載,主要是為Pytorch和Meta的推薦模型聯(lián)合設計出來的,用于推理加速。第一代MTIA基于臺積電7nm工藝打造,性能達到了102.4TOPS@INT8和51.2 TFLOPS@FP16,功耗僅有25W。
MTIA v1裸片 / Meta
單個MTIA加速器集成了64個處理單元(PE),最高128GB的片外LPDDR5內存和128MB的片上SRAM。值得一提的是,每個處理單元都由兩個RISC-V處理器核心構成,其中一個還配備了向量擴展。
從Meta公布的v1版系統(tǒng)設計上可以看出,MTIA加速器裝在了一個小型的雙M.2主板上,方便設計者輕松地集成在服務器中,通過PCIe 4.0 x8接口與主CPU相連,板卡功耗僅有35W。
當然了,作為OCP的創(chuàng)始者,Meta也在服務器的設計上采用了OCP的Yosemite V3規(guī)范,每個服務器包含12個加速器,并使用PCIe Switch相連,根據Meta的說法,加速器的數目和服務器的配置參數是為了優(yōu)化目前及未來的負載而精心選擇的。
自研視頻轉碼芯片MSVP
值得注意的是,MTIA v1還只是他們在2020年開發(fā)的第一代AI加速器,Meta的目標是設計一系列推薦用MTIA ASIC。不過,MTIA v1在自研程度上或許沒有我們想象得那么深入,比如其RISC-V核心很可能是來自第三方IP廠商的。
而與MTIA一并公開的MSVP,卻是Meta首個真正意義上的內部自研ASIC方案,專為解決Meta的視頻點播和直播負載而設計,甚至考慮到了其AR/VR業(yè)務。Meta認為,這類轉碼芯片的存在,會為Meta未來在元宇宙上布局的生成式AI短視頻,提供更多支持。
MSVP / Meta
據Meta強調,Facebook網站上的視頻流量每天就有40億播放量,所以提升壓縮效率,提供更高的穩(wěn)定性、可靠性以及近乎無限的擴展性,就成了他們對自研視頻轉碼芯片的要求。從MSVP的設計架構上來看,除了多處理器的CPU子系統(tǒng)外,芯片大部分由轉碼核心構成。
在解碼性能上,MSVP支持主流的H.264、HEVC、VP9和AV1編碼,最大支持10bit色深和YUV420色度采樣。而在編碼性能上,MSVP僅支持H.264和VP9編碼,最大支持8bit色深。
Meta給出的數據中,每個MSVP可以在最高圖像質量輸出時實現4K 15FPS的峰值轉碼速度,在標準圖像質量下實現4K 60FPS的轉碼速度,且單個PICe模塊的功耗只有10W左右。由于采用了硬件轉碼加速,MSVP是ibx264軟件編碼速度的9倍,是libVPX軟件編碼速度的50倍。
寫在最后
Meta最重要的一大營收來源就是廣告業(yè)務,所以相對其他互聯(lián)網公司,他們會將深度學習推薦模型(DLRM)放在第一位。隨著模型大小和復雜程度不斷增加,如何跟上這股趨勢同時保證ROI,就成了他們的主要問題。MTIA代表了他們在自研AI基礎設施上走出的重要一步。至于MSVP,則代表了Meta想要進一步發(fā)展短視頻、AR/VR內容的同時,減少網絡帶寬提高傳播力度的解決方案。未來Meta要想逆流而上,這些自研芯片無疑會提供不小的助力。
-
Meta
+關注
關注
0文章
277瀏覽量
11411 -
RISC-V
+關注
關注
45文章
2307瀏覽量
46300
發(fā)布評論請先 登錄
相關推薦
評論