AIGC | PC集群 | PC Farm | GPU服務(wù)器
生成式AI | Stable Diffusion | ChatGPT
2022 年 12 月,OpenAI 推出了 ChatGPT,這是一種高性能計算的大型語言生成模型。它的出現(xiàn)推動了人機(jī)對話技術(shù)的發(fā)展,并在網(wǎng)絡(luò)上引起了極大的關(guān)注。目前,全球各大科技企業(yè)都在積極擁抱 AIGC,不斷推出相關(guān)的技術(shù)、平臺和應(yīng)用。隨著人工智能技術(shù)的不斷發(fā)展,AIGC 技術(shù)也日益成熟,廣泛應(yīng)用于更多領(lǐng)域。
目前,中國是 AIGC 市場的一個重要角色,并具有快速發(fā)展的潛力。據(jù)艾媒咨詢預(yù)測,2023 年中國 AIGC 核心市場規(guī)模將達(dá) 79.3 億元,2028 年將達(dá) 2767.4 億元。中國互聯(lián)網(wǎng)的高度普及率,以及不斷提升的企業(yè)數(shù)字化程度,為 AIGC 產(chǎn)業(yè)提供了優(yōu)越的發(fā)展環(huán)境。
AIGC是人工智能與大數(shù)據(jù)、云計算、5G等多個技術(shù)領(lǐng)域的整合,是一種跨領(lǐng)域的合作發(fā)展模式。在人工智能產(chǎn)業(yè)中,算力、算法、數(shù)據(jù)是三個核心概念,它們構(gòu)成了AI領(lǐng)域的基礎(chǔ)設(shè)施,是支撐AIGC行業(yè)創(chuàng)新和發(fā)展的必要前提。
百度、阿里巴巴、騰訊、華為是國內(nèi)大模型領(lǐng)域的第一梯隊,它們在大模型研發(fā)投入、技術(shù)能力和人才團(tuán)隊實力等方面具備追趕GPT-4實力。百度旗下?lián)碛卸鄠€知名品牌,并在大模型領(lǐng)域布局廣泛,文心大模型應(yīng)用案例積累更多;阿里巴巴在淘寶、天貓、支付寶等品牌的基礎(chǔ)上,也在大模型領(lǐng)域布局廣泛,通義先布局內(nèi)部應(yīng)用;騰訊是中國最大的互聯(lián)網(wǎng)公司之一,在微信、QQ、騰訊視頻等品牌的基礎(chǔ)上,混元大模型主要服務(wù)內(nèi)部業(yè)務(wù);華為是中國最大的通信設(shè)備制造商之一,盤古大模型與華為現(xiàn)有業(yè)務(wù)結(jié)合緊密。這四家企業(yè)在大模型領(lǐng)域均有著廣泛的布局,具備強(qiáng)大的技術(shù)實力和專業(yè)人才,以滿足不同場景下的需求并提高工作效率和用戶體驗。
大模型的核心競爭要素
一、AIGC產(chǎn)業(yè)鏈發(fā)展的前提與核心要素
以GPT為代表的基礎(chǔ)模型,作為核心AI能力的供給,占據(jù)了價值鏈中最主要的環(huán)節(jié),帶領(lǐng)了整個AGI產(chǎn)業(yè)鏈的發(fā)展。由于大模型能力邊界與適用性不斷拓寬,它在迭代速度上領(lǐng)先一眾小模型,呈現(xiàn)出下探到更多下游產(chǎn)業(yè)鏈以及更加細(xì)分垂直領(lǐng)域的能力。圍繞著大模型的生態(tài)建設(shè)如火如荼,大模型的競爭格局、優(yōu)劣勢以及上下游生態(tài)也趨于穩(wěn)定。而隨著大模型的能力和發(fā)展速度趨于穩(wěn)定,應(yīng)用層也許會出現(xiàn)現(xiàn)象級消費(fèi)應(yīng)用以及垂類領(lǐng)域新龍頭,而大模型將持續(xù)受益于中下游反哺。
1、算力
AI大模型的規(guī)模龐大,需要依賴強(qiáng)大的計算資源來支持其運(yùn)行,全球芯片計算性能的持續(xù)提升為GPT的成功落地提供了重要基礎(chǔ)。以英偉達(dá)為代表的AI產(chǎn)品性能持續(xù)進(jìn)步,參數(shù)方面從V100到H100計算性能提升3倍以上,而單位功耗卻顯著優(yōu)化。H100配有Transformer引擎,可以專門用作處理類ChatGPT的AI大模型,其服務(wù)器效率是A100的10倍。
過去十年,英偉達(dá)通過提出新處理器、新系統(tǒng)、新互連、新框架和算法,并與數(shù)據(jù)科學(xué)家、AI研究人員合作開發(fā)新模型,已經(jīng)使大語言模型的處理速度提高了100萬倍。AI芯片性能的顯著提升成為近年來大模型涌現(xiàn)的算力基礎(chǔ)。2020年OpenAI推出的GPT-3大模型包含1750億參數(shù),訓(xùn)練成本達(dá)到了1200萬美元。多模態(tài)預(yù)訓(xùn)練大模型GPT-4預(yù)計規(guī)模更大,谷歌近期發(fā)布的PaLM-E包含5620億參數(shù)。如此龐大的模型如果沒有先進(jìn)算力基礎(chǔ),訓(xùn)練耗時和成本將成為不可承受之重。
2、算法
多年以來,AI理論不斷積累完善,并且GPT模型算法不斷迭代優(yōu)化,最終推出了能力出色的ChatGPT。從基于規(guī)則的算法到用于分類的機(jī)器學(xué)習(xí),再到可訓(xùn)練的深度神經(jīng)網(wǎng)絡(luò),AI技術(shù)將任務(wù)的復(fù)雜性從函數(shù)復(fù)雜度轉(zhuǎn)移到了拓?fù)浣Y(jié)構(gòu)復(fù)雜度。Transformer注意力機(jī)制進(jìn)一步模擬人腦學(xué)習(xí)方式,使自然語言處理取得了突破性進(jìn)展。
3、數(shù)據(jù)
有規(guī)模與質(zhì)量的數(shù)據(jù)要素是大模型的核心前提——ChatGPT訓(xùn)練數(shù)據(jù)達(dá)到45TB,同時基于人類反饋數(shù)據(jù)提升性能。從GPT的訓(xùn)練過程可以看出數(shù)據(jù)在大模型訓(xùn)練過程中的重要意義, 強(qiáng)化學(xué)習(xí)過程是ChatGPT 效果區(qū)別于其他模型的主要原因。
1)結(jié)構(gòu)化到非結(jié)構(gòu)化
結(jié)構(gòu)化數(shù)據(jù)即數(shù)據(jù)格式與長度規(guī)范化的數(shù)據(jù),數(shù)據(jù)量與信息含量較少,隨著AGI 能力以及學(xué)習(xí)需求提升,將會越來越多采用信息量更大的非結(jié)構(gòu)化數(shù)據(jù),包括圖像、視頻、3D(LiDAR、雷達(dá) 等)、文本和音頻等。
2)數(shù)據(jù)環(huán)節(jié)自動化比例提升
預(yù)計數(shù)據(jù)生產(chǎn)、采集、清洗、 標(biāo)注等環(huán)節(jié)自動化程度會提升,目前機(jī)器標(biāo)注、自動駕駛影子模式等技術(shù)都是數(shù)據(jù)環(huán)節(jié)自動化的例子。 數(shù)據(jù)的自動化也包括機(jī)器獨(dú)立與真實世界交互產(chǎn)生數(shù)據(jù)的過程。未來除了新的場景與新的事物需要人工參與數(shù)據(jù)環(huán)節(jié),在成熟場景的數(shù)據(jù)自動化程度會很高。
3)高質(zhì)量反饋數(shù)據(jù)決定性能
GPT訓(xùn)練的RLHF數(shù)據(jù)與其他階 段的簡單標(biāo)注數(shù)據(jù)不同,需要非常 專業(yè)的問題、指令以及符合人類邏 輯與表達(dá)的高質(zhì)量的答案。 據(jù)稱 OpenAI 內(nèi)部招了幾十名 PhDs 來做該數(shù)據(jù)的標(biāo)注以及質(zhì)量 檢測,Scale 作為 標(biāo)注供應(yīng)商,也招聘了幾十名 PhDs提供此類服務(wù)。
4)高質(zhì)量垂類數(shù)據(jù)決定壁壘
在大模型架構(gòu)基本穩(wěn)定之后, 模型競爭的核心差異點(diǎn)在于訓(xùn)練數(shù)據(jù)的獨(dú)特性。在垂直場景、業(yè)務(wù)的數(shù)據(jù)質(zhì)量決定了模型在該領(lǐng)域的表現(xiàn),如:BloombergGPT憑借3630億 個標(biāo)簽的金融領(lǐng)域數(shù)據(jù)集FINPILE 在該領(lǐng)域任務(wù)中表現(xiàn)遠(yuǎn)超其他模型。
4、生態(tài)
GPT產(chǎn)品在先發(fā)構(gòu)筑用戶心智與使用習(xí)慣方面具有競爭優(yōu)勢。ChatGPT網(wǎng)站在2023年2月的用戶訪問量超過10億次,獨(dú)立訪客數(shù)超過1.5億。隨著產(chǎn)品功能的不斷完善,AIGC模型本身有望成為超級流量入口,與用戶在各種場景直接交互。此外,數(shù)據(jù)是大模型關(guān)鍵要素。通過先發(fā)構(gòu)筑生態(tài),GPT獲得更多的場景與用戶數(shù)據(jù)訓(xùn)練,使其產(chǎn)品力領(lǐng)先于其他模型。同時,大量互聯(lián)網(wǎng)與軟件應(yīng)用積極與GPT融合,一旦生態(tài)構(gòu)筑,面臨遷移成本,一定程度上類似操作系統(tǒng)的生態(tài)。
AIGC國內(nèi)大廠的應(yīng)用
由于國內(nèi)大模型尚未完全成熟,大部分企業(yè)產(chǎn)品處于研發(fā)或準(zhǔn)備應(yīng)對AIGC模型帶來的影響階段,但隨著后續(xù)大模型持續(xù)落地與完善,預(yù)計將給相關(guān)產(chǎn)業(yè)帶來新的機(jī)遇與挑戰(zhàn)。在海外已嫁接大模型的應(yīng)用案例中,企業(yè)具備原有產(chǎn)品使用場景不會被AI替代、有獨(dú)特垂直的高質(zhì)量數(shù)據(jù)以及用戶粘性和深度等稟賦更有利于把握AI機(jī)遇。國內(nèi)頭部互聯(lián)網(wǎng)企業(yè)騰訊、阿里巴巴、百度、華為、字節(jié)跳動除了在AI與大模型領(lǐng)域有積累與積極布局,本身產(chǎn)品場景生態(tài)也有望較大受益于AIGC技術(shù)帶來的巨大效率提升。此外,在垂直細(xì)分領(lǐng)域方面,辦公、金融、電商、教育等相關(guān)企業(yè)擁有核心關(guān)注場景壁壘和高質(zhì)量獨(dú)占數(shù)據(jù)優(yōu)勢,也有望受益于AIGC技術(shù)的發(fā)展。
一、騰訊:流量與場景受益大模型能力,有望優(yōu)化成本與打開商業(yè)化空間
騰訊是國內(nèi)最核心的社交流量匯聚和內(nèi)容分發(fā)平臺。AIGC大模型技術(shù)能夠帶來內(nèi)容成本優(yōu)化與體驗提升,進(jìn)一步完善平臺內(nèi)的內(nèi)容生態(tài);同時,在to B領(lǐng)域也有望提供更多的增值服務(wù)并創(chuàng)造更多需求。
1、用戶流量
微信月活超13億,QQ月活5.7億,用戶高粘性且熟人社交場景基本不受AIGC技術(shù)沖擊,因此未來這兩大平臺的核心流量池和內(nèi)容分發(fā)平臺地位將保持穩(wěn)固。
2、場景與數(shù)據(jù)
1)游戲與影視文娛等
騰訊作為國內(nèi)最大的游戲、影視文娛生產(chǎn)商與分發(fā)平臺,擁有全維度內(nèi)容服務(wù),包括騰訊游戲、視頻號、長視頻、網(wǎng)文、公眾號、音樂、直播等。其獨(dú)占大量內(nèi)容數(shù)據(jù),2022年游戲收入超過1700億元,視頻號MAU超過8億(截至2022年6月),微信搜一搜MAU也超過8億。這龐大的內(nèi)容生態(tài)和成本投入有望在AIGC技術(shù)帶來的效率提升和體驗優(yōu)化方面獲得大幅改善。
2)企業(yè)服務(wù)
除了C端內(nèi)容,騰訊還提供騰訊云、企業(yè)微信、騰訊會議等企業(yè)服務(wù)。但現(xiàn)階段整體尚未實現(xiàn)盈利。借鑒微軟辦公和云產(chǎn)品受益于GPT技術(shù)的提升,AIGC技術(shù)賦能下有望提高相關(guān)產(chǎn)品的效率價值,并提升其商業(yè)化水平。
3)廣告營銷
2022年騰訊廣告收入超過800億元,主要與社交內(nèi)容相關(guān)。AI技術(shù)有望持續(xù)提升內(nèi)容效率和產(chǎn)品創(chuàng)新,從而提升廣告的效率和體驗。
3、AI工程能力
騰訊在技術(shù)和人才方面儲備充分,截止2022年底研發(fā)人員規(guī)模約8萬人,占比74%。公司積極布局混元大模型,在AI技術(shù)研發(fā)和應(yīng)用落地方面同步推進(jìn)。這些努力有望持續(xù)提升運(yùn)營效率、產(chǎn)品創(chuàng)新以及增值服務(wù)。
4、算力基礎(chǔ)
隨著算力的發(fā)展,模型容量持續(xù)提升,模型通用性和泛化能力也更強(qiáng)。近兩年來,國內(nèi)外頭部科技公司均有布局,發(fā)布了若干千億規(guī)模以上的大模型。騰訊作為一家擁有強(qiáng)大底層算力和低成本高速網(wǎng)絡(luò)基礎(chǔ)設(shè)施的企業(yè),在混元AI大模型方面取得了重要進(jìn)展。騰訊推出了HunYuan-NLP 1T大模型,并在國內(nèi)最權(quán)威的自然語言理解任務(wù)榜單CLUE上一度登頂。該模型是業(yè)界首個可在工業(yè)界海量業(yè)務(wù)場景直接落地應(yīng)用的萬億NLP大模型。騰訊混元AI大模型協(xié)同了預(yù)訓(xùn)練研發(fā)力量,旨在打造業(yè)界領(lǐng)先的AI預(yù)訓(xùn)練大模型和解決方案?,F(xiàn)在,騰訊混元AI大模型完整覆蓋NLP大模型、CV大模型、多模態(tài)大模型、文生圖大模型及眾多行業(yè)/領(lǐng)域任務(wù)模型。
二、阿里巴巴:技術(shù)積累深厚,AI有望賦能電商內(nèi)容及打開市場空間
阿里巴巴是國內(nèi)主要的電商平臺,同時在云計算、企業(yè)服務(wù)相關(guān)業(yè)務(wù)方面具有出色競爭力。該公司長期投入 AI 領(lǐng)域,并已經(jīng)開展通用大型模型的公測。目前,在應(yīng)用端方面還處于探索階段。AIGC 技術(shù)有望通過內(nèi)容成本優(yōu)化和產(chǎn)品創(chuàng)新來提升電商和 to B 領(lǐng)域商業(yè)價值,從而提高業(yè)務(wù)效率。
1、用戶流量
淘寶是一家垂直電商領(lǐng)域的公司,其年活躍用戶數(shù)接近9億,GMV約達(dá)8萬億元。由于在電商生態(tài)、數(shù)據(jù)處理和復(fù)雜場景流程方面具有深厚的積累,因此其業(yè)務(wù)基本盤不能簡單地用大型模型代替。
2、場景與數(shù)據(jù)
1)電商
淘寶等電商平臺需要大量的文本和圖片內(nèi)容來支持其業(yè)務(wù)需求,這些場景包括電商圖片和文案、短視頻、直播帶貨以及智能客服營銷。AI 技術(shù)有望通過降低電商生態(tài)中的內(nèi)容成本、優(yōu)化用戶體驗以及提升電商平臺的內(nèi)容水平,從而為電商行業(yè)帶來更多的發(fā)展機(jī)遇。
2)廣告營銷
AI技術(shù)有望提高電商搜索的效率和用戶體驗,特別是對于以消費(fèi)者為中心的阿里媽媽等產(chǎn)品,AI技術(shù)可以幫助他們進(jìn)行更有效的營銷、更深入的消費(fèi)者數(shù)據(jù)洞察,并且生成相關(guān)的圖文視頻內(nèi)容,從而提高營銷轉(zhuǎn)化率。
3)企業(yè)服務(wù)
阿里巴巴提供了阿里云、釘釘?shù)绕髽I(yè)服務(wù),AI技術(shù)的應(yīng)用有望提高這些產(chǎn)品的效率和商業(yè)化水平,從而刺激更多的AI云需求。
4)AioT
在AI技術(shù)的賦能下,智能終端產(chǎn)品如天貓精靈等有望獲得大幅提升的用戶體驗。
3、AI工程能力
阿里巴巴在技術(shù)儲備和人才方面充分準(zhǔn)備,到2022年底總員工數(shù)超過20萬人,其中技術(shù)人員占比超過一半,總部人員超過10萬人。阿里的達(dá)摩院在技術(shù)領(lǐng)域積累了深厚的實力,通用大型模型即將發(fā)布,同時AI技術(shù)研發(fā)與應(yīng)用落地同步推進(jìn),這些努力有望持續(xù)提高運(yùn)營效率、產(chǎn)品創(chuàng)新以及增值服務(wù)的質(zhì)量。
4、算力基礎(chǔ)
阿里巴巴大模型研發(fā)的算力基礎(chǔ)包括基于GPU的深度學(xué)習(xí)計算平臺和基于云計算的分布式訓(xùn)練平臺。
GPU的深度學(xué)習(xí)計算平臺可以有效地加速深度學(xué)習(xí)算法的訓(xùn)練過程。阿里巴巴在研發(fā)中使用了多種GPU計算平臺,包括NVIDIA Tesla P100和V100等。
基于云計算的分布式訓(xùn)練平臺可以實現(xiàn)多臺計算機(jī)協(xié)同訓(xùn)練大規(guī)模模型,使得訓(xùn)練速度大幅提升。阿里巴巴基于自主研發(fā)的分布式計算框架AliTianchi,采用了多種優(yōu)化策略,包括參數(shù)服務(wù)器、梯度壓縮和通信優(yōu)化等,以提高分布式訓(xùn)練的效率和可擴(kuò)展性。同時,阿里巴巴還在云計算平臺上提供了云端GPU計算服務(wù),為開發(fā)者提供了快速高效的大規(guī)模模型訓(xùn)練能力。
三、百度:大模型產(chǎn)品先發(fā),核心搜索業(yè)務(wù)機(jī)遇與挑戰(zhàn)并存
百度是中國重要的搜索引擎門戶,其擁有大量中文互聯(lián)網(wǎng)信息數(shù)據(jù)池和技術(shù)積累。百度在AI和云計算領(lǐng)域持續(xù)投資,并已經(jīng)先行發(fā)布了文心一言模型,此舉有望提升搜索產(chǎn)品體驗,同時也為基于大型模型的產(chǎn)品拓展更多客戶打下了基礎(chǔ)。然而,在搜索和大型模型場景之間存在一定的替代性,因此對于百度應(yīng)用落地角度來說,既有機(jī)遇也存在挑戰(zhàn)。
1、用戶流量
截至2022年底,百度搜索的月活躍用戶超過6億,近年來用戶規(guī)模整體穩(wěn)定,而在線營銷收入也超過了700億元。然而,在中國互聯(lián)網(wǎng)流量被分割的情況下,淘寶搜索、微信搜一搜、抖音搜索、搜狗、360等在不同場景和市場中共享不同份額,因此搜索引擎的體驗和性能仍然是關(guān)鍵的競爭因素。
2、場景與數(shù)據(jù)
總體來說,百度在深耕國內(nèi)搜索領(lǐng)域方面表現(xiàn)出色,其中文互聯(lián)網(wǎng)信息圖文數(shù)據(jù)語料積累領(lǐng)先。然而,從場景角度來看,考慮大型模型回答問題能力與傳統(tǒng)搜索存在一定的功能重合,雖然提升了用戶效率,但可能會減少用戶對網(wǎng)頁的瀏覽,降低廣告位曝光。目前,new bing和谷歌已經(jīng)推出了搜索+大型模型,但百度尚未將大型模型正式融入到搜索產(chǎn)品中,因此其對搜索引擎競爭力的正面影響以及對商業(yè)化潛在的負(fù)面影響有待跟蹤評估。在業(yè)務(wù)拓展方面,百度文心產(chǎn)品已經(jīng)提供了API服務(wù),截至3月18日,該公司稱申請企業(yè)客戶超過9萬,合作咨詢超過6000條。百度智能家居業(yè)務(wù)也有望受益于大型模型技術(shù)。
3、AI工程能力
百度在AI領(lǐng)域擁有長期的技術(shù)積累和人才儲備,在推薦引擎、深度學(xué)習(xí)、智能駕駛、全屋智能等領(lǐng)域都有相應(yīng)的布局。截至2022年底,百度總員工數(shù)超過4萬人,其中有2.4萬名員工從事技術(shù)研發(fā)工作。通過率先推出文心一言大型模型產(chǎn)品,百度展現(xiàn)了其在AI領(lǐng)域的技術(shù)積累和能力。
四、華為盤古大模型研究:盤古開天,AI落地
目前,盤古大型模型在100多個行業(yè)場景中完成了驗證,包括能源、零售、金融、工業(yè)、醫(yī)療、環(huán)境、物流等領(lǐng)域。該模型涉及千億參數(shù)、40TB訓(xùn)練數(shù)據(jù),對算法、算力、海量數(shù)據(jù)處理和并行優(yōu)化提出了很大挑戰(zhàn)。為了解決這些問題,華為云算法團(tuán)隊和循環(huán)智能(Recurrent AI)的NLP團(tuán)隊合作攻關(guān),突破了大型模型微調(diào)的難題。鵬城實驗室的鵬城云腦II是國內(nèi)最大規(guī)模的AI訓(xùn)練集群,在盤古大型模型的訓(xùn)練中提供了強(qiáng)大的AI算力和數(shù)據(jù)吞吐能力,為其打下堅實的基礎(chǔ)。此外,華為底層軟件、訓(xùn)練框架和ModelArts平臺協(xié)同優(yōu)化,充分釋放算力,達(dá)到了全棧性能最優(yōu)狀態(tài)。
具體來看,盤古大型模型利用華為CANN采用了算子量化、算子融合優(yōu)化等技術(shù),針對底層算子性能進(jìn)行了優(yōu)化,每個單算子的性能都提升了30%以上。華為MindSpore采用了“流水線并行、模型并行和數(shù)據(jù)并行”的多維自動混合并行技術(shù),大幅降低了手動編碼的工作量,并提升集群線性度20%。華為云ModelArts平臺提供E級算力調(diào)度,同時結(jié)合物理網(wǎng)絡(luò)拓?fù)?,提供動態(tài)路由規(guī)劃能力,為大型模型訓(xùn)練提供了最優(yōu)的網(wǎng)絡(luò)通信能力。借助ModelArts平臺高效處理海量數(shù)據(jù)的能力,盤古大型模型僅用7天就完成了40TB文本數(shù)據(jù)的處理。一站式AI開發(fā)平臺ModelArts為盤古大型模型的訓(xùn)練和推理提供計算優(yōu)化、通信優(yōu)化、存儲優(yōu)化以及算法優(yōu)化,是其重要的基礎(chǔ)平臺資源。
1、泛化能力極強(qiáng)、適用大量復(fù)雜行業(yè)場景
盤古大型模型具備極強(qiáng)的泛化能力,一個模型適用于大量復(fù)雜行業(yè)場景。在to B以及to C場景下,盤古大型模型具有良好的泛用性,大規(guī)模參數(shù)的模型可以更深層挖掘數(shù)據(jù)背后的邏輯,達(dá)到更高的泛化性能,對不同場景的魯棒性更強(qiáng)。同時,盤古大型模型吸收了海量數(shù)據(jù)知識,學(xué)習(xí)了40TB的中文文本數(shù)據(jù),包含30億+參數(shù)的CV大型模型通過行業(yè)數(shù)據(jù)的小樣本調(diào)優(yōu),提高了模型在場景中的應(yīng)用性能和泛化能力,減少對領(lǐng)域數(shù)據(jù)標(biāo)注的依賴。
此外,基于產(chǎn)業(yè)場景中存在大量的內(nèi)容理解需求,盤古大型模型采用兼顧架構(gòu),在預(yù)訓(xùn)練階段沉淀了大量的通用知識,能夠同時完成理解與生成任務(wù),使得大型模型有能力支持行業(yè)知識庫和數(shù)據(jù)庫的嵌入,對接行業(yè)經(jīng)驗。隨著盤古大型模型的開放,各行各業(yè)的開發(fā)者不必再“從零開始”,只需在云上找到所需要的模型,助力各行各業(yè)加速智能化轉(zhuǎn)型。大型模型在實際場景中的應(yīng)用不僅可以幫助用戶提高訓(xùn)練進(jìn)度并且縮短訓(xùn)練時間,隨著模型上應(yīng)用數(shù)量不斷增多,用戶成本亦會有所降低。
2、工業(yè)化 AI 開發(fā)模式賦能千行百業(yè)
盤古大型模型是一種工業(yè)化AI開發(fā)的新模式,相對于傳統(tǒng)的“作坊模式”AI開發(fā)過程,可以解決小模型的定制化難題,使一個模型應(yīng)用到多個場景中。盤古大模型AI開發(fā)門檻較低,能夠提供自動化工作流,減少對AI開發(fā)工程師的專業(yè)依賴,同時可以根據(jù)更新數(shù)據(jù)快速進(jìn)行模型迭代,做到“邊用邊學(xué)”。盤古CV大模型首次兼顧了圖像判別與生成能力,能同時滿足底層圖像處理與高層語義的理解需求,融合行業(yè)知識的微調(diào),快速適配各種下游任務(wù),在100余項實際任務(wù)中得到驗證,節(jié)約90%以上的研發(fā)成本。此外,盤古CV大模型在預(yù)訓(xùn)練階段主要集中在數(shù)據(jù)處理、架構(gòu)設(shè)計和模型優(yōu)化三個階段進(jìn)行優(yōu)化,在ImageNet 1%、10%數(shù)據(jù)集上的小樣本分類精度上均達(dá)到目前業(yè)界最高水平。
AIGC在游戲行業(yè)的應(yīng)用
ChatGPT是一款功能全面的機(jī)器人,不僅限于對話,其本質(zhì)是通過對話完成各種任務(wù)。GPT機(jī)器人具有強(qiáng)大的語言處理能力、縝密的邏輯推理、完善的認(rèn)知體系和豐富的接口生態(tài)。由于其在快速信息獲取、教人類學(xué)習(xí)、生成有價值的內(nèi)容、流暢的對話以及協(xié)助人類進(jìn)行生產(chǎn)操作等方面的優(yōu)勢,已經(jīng)得到了廣泛的應(yīng)用。ChatGPT已經(jīng)被應(yīng)用于各種領(lǐng)域,例如辦公、金融、電商、設(shè)計、社交、游戲等,成為為人類提供幫助的重要工具之一。本節(jié)內(nèi)容將具體從AIGC在游戲行業(yè)的應(yīng)用為大家展開詳細(xì)的介紹。
一、全球游戲市場規(guī)模不斷擴(kuò)大
根據(jù)Newzoo的數(shù)據(jù),全球游戲市場規(guī)模在2016年的1011億美元基礎(chǔ)上持續(xù)增長,到2021年時已經(jīng)達(dá)到1927億美元,五年間增長接近一倍,預(yù)計2022年將達(dá)到1968億美元,2025年將增長至2257億美元。隨著游戲玩家數(shù)量不斷增長,預(yù)計2022年將達(dá)到32億人,占全球總?cè)丝诘?0%。目前,全球游戲玩家數(shù)量約為30.6億人,占全球總?cè)丝诘谋壤秊?8.25%。預(yù)計到2025年,全球游戲玩家數(shù)量將增長至35.3億人,年復(fù)合增長率為4.2%。
二、游戲制作
游戲行業(yè)的競爭主要集中在制作環(huán)節(jié)和營銷環(huán)節(jié),而優(yōu)秀的游戲制作是游戲營銷的基礎(chǔ)。然而,傳統(tǒng)游戲制作中存在“質(zhì)量、速度、成本”三個因素之間的矛盾。要在保證游戲質(zhì)量的前提下,制作一款游戲只有兩條路徑可選:一是大量開發(fā)人員同時制作一款游戲,但大規(guī)模團(tuán)隊管理、開發(fā)效率較低,開發(fā)成本勢必提高;二是精簡團(tuán)隊成員,制作周期長達(dá)數(shù)年甚至十?dāng)?shù)年。
通常情況下,優(yōu)質(zhì)的3A大作的開發(fā)時間成本和資金成本都非常高。以銷量超過4600萬份的《荒野大鏢客:救贖2》為例,該游戲擁有超過28平方英里大小接近真實景象的地圖和1000個NPC。即使擁有專職開發(fā)人員超過1200人的團(tuán)隊,也用了8年的時間才完成,成本逼近3億美元。另外,《星際公民》的專職開發(fā)人員數(shù)量少于《荒野大鏢客:救贖2》,但該游戲已開發(fā)了10年,并仍處于Alpha版本測試階段,預(yù)計仍需要較長時間才能完整上線。
游戲制作流程復(fù)雜,設(shè)計開發(fā)環(huán)節(jié)最為關(guān)鍵。游戲的制作一般包括“產(chǎn)品立項-目標(biāo)規(guī)劃-設(shè)計開發(fā)-發(fā)布運(yùn)營”四 個環(huán)節(jié),制作周期一般以年為單位,制作流程的復(fù)雜程度和時間成本遠(yuǎn)超娛樂媒體領(lǐng)域的其他內(nèi)容。在游戲的制 作流程中,設(shè)計開發(fā)環(huán)節(jié)決定了規(guī)劃的落地程度,極大程度上影響游戲質(zhì)量以及玩家體驗,是最為關(guān)鍵的一環(huán)。
游戲是娛樂及媒體行業(yè)中最復(fù)雜的形式,構(gòu)成要素包含娛樂媒體領(lǐng)域內(nèi)容的所有形式。游戲包含文本、圖像、 音效、音樂、3D模型、動畫、電影、代碼等多種類型的資源,涵蓋了娛樂及媒體行業(yè)所有的內(nèi)容形式。
三、AIGC對游戲制作的影響
游戲是需要實時交互的最高形式,因此也是最綜合復(fù)雜的娛樂形式。游戲制作的要素復(fù)雜,制作門檻極高,也決定了生成式人工智能對游戲制作的影響是其他娛樂及媒體領(lǐng)域的合力,也是最有可能發(fā)揮巨大作用的產(chǎn)業(yè)。
AIGC主要通過對已有文本進(jìn)行續(xù)寫、語音合成、生成主題音樂、圖像生成、三維建模以及代碼生成等功能來提高制作效率,做到游戲策劃、音頻、美術(shù)和程序等環(huán)節(jié)的高效生成,同時降低游戲制作成本。以二維游戲原畫為例,傳統(tǒng)的原畫師需要花費(fèi)數(shù)周時間來根據(jù)策劃內(nèi)容完成設(shè)計稿,而使用AIGC只需要輸入關(guān)鍵詞便能得到大量的設(shè)計初稿,后續(xù)進(jìn)行篩選和修改即可,時間降低到幾個小時。因此,AIGC的應(yīng)用將打破游戲制作的不可能三角。
游戲開發(fā)的專業(yè)技術(shù)和經(jīng)驗門檻很高,要求資金投入和傳統(tǒng)AI算法積累,因為游戲綜合復(fù)雜程度非常高。比如字節(jié)跳動,雖然在推薦算法、用戶數(shù)據(jù)積累、資金和流量渠道等方面優(yōu)勢突出,但是在游戲領(lǐng)域卻未能復(fù)制其在抖音和今日頭條等領(lǐng)域的成功。雖然該公司組建了大中型游戲研發(fā)團(tuán)隊并投入了數(shù)百億資金,但仍未能推出自研S級游戲。主要原因在于公司晚入游戲市場,缺乏游戲制作方面的豐富經(jīng)驗和專業(yè)技術(shù)人才。盡管公司試圖以技術(shù)優(yōu)勢建立游戲中臺來加速游戲研發(fā),但開發(fā)人員對游戲了解不夠,導(dǎo)致中臺偏向于代碼思維,在便利性和使用效果方面不如網(wǎng)易的編輯器。
AIGC制作游戲內(nèi)容價格低廉且不需要大量的專業(yè)技術(shù)人才,可以大幅降低游戲制作門檻,使微型游戲制作工作室成為現(xiàn)實。AIGC制作游戲內(nèi)容具有一次開發(fā)調(diào)試多次長期復(fù)用的特點(diǎn),而專業(yè)生成式模型開發(fā)公司可以提供B端產(chǎn)品,將設(shè)計人員的創(chuàng)意轉(zhuǎn)化為設(shè)計初稿,大幅度降低內(nèi)容制作的時間和金錢成本,同時減少對專業(yè)技術(shù)人才的需求。例如,由5人組成的Innersloth工作室開發(fā)的《Among Us》在Steam上銷售超過2000萬份,全球玩家數(shù)量約為5億。隨著AIGC的不斷發(fā)展,微型游戲制作工作室的數(shù)量和可開發(fā)的游戲規(guī)模將不斷上升。
游戲的創(chuàng)新表現(xiàn)在多個方面,主要受到創(chuàng)意和產(chǎn)能兩個因素的限制。策劃是游戲的起點(diǎn),美術(shù)設(shè)計是到游戲形 象、畫面的關(guān)鍵,游戲創(chuàng)新依賴于策劃、美術(shù)人員的創(chuàng)意,而從創(chuàng)意到成品要經(jīng)過漫長的開發(fā)過程,產(chǎn)能也是限 制游戲創(chuàng)新的關(guān)鍵一環(huán)。
AIGC提高生產(chǎn)力突破產(chǎn)能限制實現(xiàn)游戲創(chuàng)新:
1、AI生成3D模型助力飛行模擬器實現(xiàn)3D高清全球地圖:微軟的飛行模擬器計劃開始于1976年,一直在向著高 清、3D、全球地圖努力,最新版本通過與blackshark.ai合作,使用AI從2D衛(wèi)星圖像生成3D模型,構(gòu)建了超 過15億的3D建筑模型,突破了產(chǎn)能的限制,飛行區(qū)域包括整個地球、超過24000個機(jī)場,且主要地標(biāo)和熱 門城市的地景越來越豐富。
2、AI賦能NPC打造原神高品質(zhì)開放世界:開放世界游戲在上世紀(jì)80年代便出現(xiàn),原神開發(fā)中使用AI賦予了每 個NPC不同的個性及特殊能力,打造了更為完備的高品質(zhì)開放世界,獲得成功。
AIGC技術(shù)通過轉(zhuǎn)型性創(chuàng)作和組合性創(chuàng)作等方式,突破了個人創(chuàng)意的局限性,拓寬了游戲策劃設(shè)計的邊界。其中,繼續(xù)性創(chuàng)作指學(xué)習(xí)已完成要素的特征,進(jìn)行繼續(xù)性創(chuàng)作。例如,AI可以續(xù)寫文案、生成同一風(fēng)格系列的圖片等,這種方法適用于那些已經(jīng)完成部分設(shè)計但是想象力枯竭的情況,能夠通過大量繼續(xù)性創(chuàng)作擴(kuò)展人的想象力。而組合性創(chuàng)作則是將不同領(lǐng)域、不同維度的原本無關(guān)的概念元素進(jìn)行組合,創(chuàng)造出新的概念元素,從而為游戲的關(guān)卡設(shè)計、地圖設(shè)計、玩法設(shè)計、原畫設(shè)計等提供全新的思路。目前,圖像生成算法能夠根據(jù)輸入的文字要素生成各種風(fēng)格的圖像以及超出想象的超現(xiàn)實動物、植物、人物形象,為游戲原畫設(shè)計打開了想象空間。例如,2021年,Anurag Sarkar和Seth Cooper使用變分自編碼器(Variational auto-encoder)將不同的游戲關(guān)卡進(jìn)行組合,創(chuàng)造出新的游戲關(guān)卡。
四、藍(lán)海大腦PC 集群(PC Farm)解決方案
PC集群是一種由多臺計算機(jī)組成的系統(tǒng),這些計算機(jī)通過網(wǎng)絡(luò)連接在一起,共同完成計算任務(wù)。PC集群解決方案是指在PC集群上運(yùn)行的軟件和硬件系統(tǒng),用于管理和優(yōu)化計算資源,提高計算效率和可靠性。
藍(lán)海大腦PC集群解決方案提供高密度部署的服務(wù)器和PC節(jié)點(diǎn),采用4U機(jī)架式設(shè)計,每個機(jī)架可插拔4個PC節(jié)點(diǎn)。融合了PC的高主頻和高性價比以及服務(wù)器的穩(wěn)定性的設(shè)計,實現(xiàn)了遠(yuǎn)程集中化部署和管理運(yùn)維。同時,采用模塊化可插拔設(shè)計,使維護(hù)和升級變得更加容易。
同時,還集成了Stable Diffusion AI模型,可以輕松地安裝和使用,無需進(jìn)行任何額外的配置或設(shè)置。與傳統(tǒng)的人工創(chuàng)作方式相比,Stable Diffusion Al模型可以更快地生成高品質(zhì)的創(chuàng)作內(nèi)容。通過集成這個模型,可以使創(chuàng)作者利用人工智能技術(shù)來優(yōu)化創(chuàng)作流程。另外,藍(lán)海大腦PC集群解決方案還具有開箱即用的特點(diǎn),不僅易于安裝和使用,而且能夠快速適應(yīng)各種創(chuàng)作工作流程。這意味著用戶可以在短時間內(nèi)開始創(chuàng)作,并且在整個創(chuàng)作過程中得到更好的體驗。
免責(zé)聲明:部分內(nèi)容來源于互聯(lián)網(wǎng)及其他公眾平臺,內(nèi)容僅供讀者參考。如有侵犯版權(quán)請告知,我們將在24小時內(nèi)刪除!
審核編輯黃宇
-
AI
+關(guān)注
關(guān)注
87文章
30894瀏覽量
269085 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5503瀏覽量
121162 -
ChatGPT
+關(guān)注
關(guān)注
29文章
1561瀏覽量
7670 -
AIGC
+關(guān)注
關(guān)注
1文章
362瀏覽量
1543
發(fā)布評論請先 登錄
相關(guān)推薦
評論