【Gemini 大模型主打多模態(tài),性能對(duì)標(biāo) GPT-4】
當(dāng)?shù)貢r(shí)間12月6日, 谷歌公司宣布推出其規(guī)模最大、功能最強(qiáng)的多模態(tài)大模型 Gemini, 其最強(qiáng)大的 TPU (張量處理單元)系統(tǒng) “Cloud TPU v5p”, 以及來自谷歌云的人工智能超級(jí)計(jì)算機(jī)。
本次谷歌推出的多模態(tài)大模型Gemini 依然采用Transformer架構(gòu),采用高效Attention機(jī)制,支持32k 的上下文長度。Gemini 主打在多模態(tài)領(lǐng)域的突出能力,在輸入端, Gemin 可以適應(yīng)文本與音視頻交叉的輸入序列,比如自然圖像、圖表、截圖、pdf 和視頻等。在輸出端,Gemini 兼具文本和圖像兩種輸出形式。與市面上大模型不同的地方在于,Gemini 從設(shè)計(jì)之初開始就是多模態(tài)的,并不像 OpenAI 構(gòu)建 DALL·E和 Whisper 單獨(dú)訓(xùn)練圖像和語音模型。
Gemini 1.0家族涵蓋三類模型,各有定位:
1)Gemini Ultra: 用于高度復(fù)雜的任務(wù),為規(guī)模最大、功能最強(qiáng)的類別,定位為GPT-4的競(jìng)爭(zhēng)對(duì)手;
2)Gemini Pro: 是一款中端型號(hào), 用于增強(qiáng)性能和大規(guī)模部署能力,根據(jù)谷歌技術(shù)報(bào)告,其性能優(yōu)于GPT-3.5;
3)Gemini Nano: 主要用于特定任務(wù)和移動(dòng)設(shè)備。
模型能力方面, Gemini 系列在文本、多模態(tài)、模態(tài)組合等領(lǐng)域均實(shí)現(xiàn)了較大進(jìn)展,在絕大多數(shù)基準(zhǔn)測(cè)試中性能領(lǐng)先于GPT-4。
我們認(rèn)為,此次AI 模型Gemini 的推出對(duì)AI 產(chǎn)業(yè)鏈上下游均有不同程度的帶動(dòng)作用。上游層面,受益于AI 巨頭在大模型領(lǐng)域的競(jìng)爭(zhēng)白熱化, AI 算力需求持續(xù)增進(jìn);下游層面AIGC產(chǎn)業(yè)可借助大模型應(yīng)用變革內(nèi)容生產(chǎn)方式,擴(kuò)大發(fā)展空間。
【國內(nèi)AI 大模型加速布局,推動(dòng)下游AIGC 業(yè)務(wù)發(fā)展】
AIGC 相關(guān)應(yīng)用方面的創(chuàng)新主要包括兩種大模型的應(yīng)用分支:
生成對(duì)抗網(wǎng)絡(luò) (GAN)/ 擴(kuò)散模型 (Diffusion);
Transformer 預(yù)訓(xùn)練大模型。在國外AIGC 應(yīng)用大規(guī)模運(yùn)用大模型技術(shù)的同 時(shí),我國企業(yè)也在加快對(duì)大模型產(chǎn)品的布局。云廠商、AI 大廠、創(chuàng)企、各行業(yè) 公司及技術(shù)服務(wù)商等產(chǎn)業(yè)各領(lǐng)域玩家也在陸續(xù)推出大模型或基于大模型的應(yīng)用產(chǎn)品及各類技術(shù)服務(wù)。
AIGC 產(chǎn)業(yè)擁有巨大的發(fā)展?jié)摿εc成長空間,可借助大模型變革內(nèi)容生產(chǎn)方式,提升生產(chǎn)效率和創(chuàng)意。
根據(jù)艾瑞咨詢預(yù)測(cè), 2028年我國AIGC 產(chǎn)業(yè)預(yù)計(jì)規(guī)模將達(dá)到7202億元,將完成在重點(diǎn)領(lǐng)域、關(guān)鍵場(chǎng)景的技術(shù)價(jià)值兌現(xiàn),并逐步建立完善的模型即服務(wù)產(chǎn)業(yè) 生態(tài),預(yù)計(jì)2030年中國AIGC 產(chǎn)業(yè)規(guī)模將突破至11441億元。大模型對(duì)內(nèi)容理解 和內(nèi)容生成的雙向能力使其既能以極低門檻實(shí)現(xiàn)多模態(tài)內(nèi)容生成,也可脫離內(nèi)容生產(chǎn)核心場(chǎng)景泛化為一種人機(jī)對(duì)話的媒介。
未來,全行業(yè)將借助大模型能力衍生出的大量AI 生產(chǎn)工具,實(shí)現(xiàn)內(nèi)容生產(chǎn)效率的飛躍,并進(jìn)一步降低數(shù)字生態(tài)的人機(jī)交互門檻!
【多模態(tài)大模型呼喚更多算力,開啟上游服務(wù)器新發(fā)展】
Gemini1.0 號(hào)稱具有原生多模態(tài)能力,能夠處理視頻、音頻、圖像、文本和代碼等多種形式的內(nèi)容,且性能優(yōu)于現(xiàn)有的“拼接型”多模態(tài)大模型。從谷歌官方公布的技術(shù)文檔中的示例來看,Gemini 不僅能夠進(jìn)行雙模態(tài)之間的轉(zhuǎn)換(如文生圖或文生視頻),亦能處理需要進(jìn)行多模態(tài)轉(zhuǎn)換的復(fù)雜任務(wù)。
多模態(tài)大模型的算力需求遠(yuǎn)高于純文本模態(tài)。 以 Gemini 為例,其強(qiáng)大的多模態(tài)能力背后,是龐大的算力需求。雖然沒有正式公布,但根據(jù)內(nèi)部消息,Gemini 有萬億參數(shù),訓(xùn)練所用的算力甚至達(dá)到GPT-4的五倍。有別于傳統(tǒng)大模型對(duì)英偉達(dá)硬件及生態(tài)的依賴,Gemini 訓(xùn)練所需的算力基于谷歌自研的 TPUv4 和 v5e等硬件。
在推出新模型的同時(shí),谷歌順勢(shì)宣布推出迄今為止功能最強(qiáng)大、最高效、可擴(kuò)展性最強(qiáng)的 TPU 系統(tǒng) Cloud TPU v5p,將用于開發(fā)更高層次的AI 大模型。其 TPU v5p的訓(xùn)練性能是上一代 TPU v4的2.8倍,內(nèi)存帶寬提升3倍,芯片間互聯(lián)帶寬翻倍,達(dá)到4.8Tbps, 同時(shí),v5p 單個(gè) POD 中的芯片數(shù)量翻倍,達(dá)到8960顆。
受到人工智能大模型的發(fā)展熱潮影響,AI服務(wù)器的需求量將大幅度增加。 數(shù)量方面,根據(jù)TrendForce 預(yù)測(cè),2023 年全球 AI 服務(wù)器出貨量將接近120萬臺(tái),年增長率接近38.4%,占整體服務(wù)器的9%。預(yù)計(jì)到2025年整體出貨量將增加至190萬臺(tái),2022-2025年年復(fù)合增長率將達(dá)到30.4%。
價(jià)格方面,通用服務(wù)器價(jià)格一般為幾千美金/臺(tái),而主流AI 服務(wù)器價(jià)格多在 10-15萬美金/臺(tái),單價(jià)呈現(xiàn)指數(shù)型提升。 根據(jù)中商情報(bào)網(wǎng)預(yù)計(jì),2022年全球 AI 服務(wù)器市場(chǎng)規(guī)模約為183億美元,預(yù)計(jì)2023年將達(dá)到211億美元,同比增長率高達(dá)15.3%。
我們篩選出以下潛力標(biāo)的
紫光股份(000938)公司發(fā)布了全新一代自研八路關(guān)鍵業(yè)務(wù)服務(wù)器H3C UniServer R8900 G3,可支持高達(dá)8顆高端處理器,224個(gè)計(jì)算核心,具備96個(gè)內(nèi)存插槽, 滿足核心數(shù)據(jù)庫,虛擬化,高性能計(jì)算,人工智能,內(nèi)存計(jì)算等多種關(guān)鍵業(yè)務(wù)場(chǎng)景運(yùn)算需求。
中科曙光(603019)公司通用服務(wù)器產(chǎn)品、存儲(chǔ)產(chǎn)品在國內(nèi)市場(chǎng)上處于領(lǐng)先地位。具有完整的產(chǎn)品線,能夠滿足各類細(xì)分市場(chǎng)的需求。
浪潮信息(000977) 目前,公司已成為百度、阿里巴巴、騰訊等客戶最主要的AI 服務(wù)器供應(yīng)商。
參考資料:
平安證券-計(jì)算機(jī)行業(yè)動(dòng)態(tài)跟蹤報(bào)告:多模態(tài)能力表現(xiàn)亮眼,谷歌攜Gemini 王者歸來-231208.pdf
上海證券-通信行業(yè)周報(bào):最強(qiáng)AI 模型Gemini 正式發(fā)布,多模態(tài)應(yīng)用前景廣闊-231215.pdf
審核編輯 黃宇
-
驅(qū)動(dòng)
+關(guān)注
關(guān)注
12文章
1844瀏覽量
85404 -
計(jì)算機(jī)
+關(guān)注
關(guān)注
19文章
7522瀏覽量
88302 -
算力
+關(guān)注
關(guān)注
1文章
1001瀏覽量
14877
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論