近期,ChatGPT以百科全書(shū)般的功能引發(fā)了業(yè)界關(guān)注,作為下一個(gè)探索熱點(diǎn),AIGC也激發(fā)了大量的行業(yè)需求。AIGC將如何重塑內(nèi)容生態(tài)?算力作為AIGC應(yīng)用背后的關(guān)鍵,AIGC對(duì)算力有哪些需求?2月10日,摩爾學(xué)院院長(zhǎng)李豐做客網(wǎng)易科技《邁向AIGC大淘金時(shí)代》直播連線,并帶來(lái)《全功能GPU是AIGC的算力底座》為主題的分享。
以下是經(jīng)過(guò)整理的訪談實(shí)錄:
主持人:大家在接觸ChatGPT之后,會(huì)有一種被震撼的感覺(jué)。其實(shí)AIGC對(duì)于目前的內(nèi)容創(chuàng)作,更多是一種輔助,之后是和人類合作,最后它到達(dá)自主的原創(chuàng)階段。其中每一個(gè)階段,需要在算法或者數(shù)據(jù)訓(xùn)練方面做出哪些突破,距離AIGC真正高度取代人類又有多遠(yuǎn)的距離?
李豐:首先,現(xiàn)在ChatGPT也好,AIGC也好,已經(jīng)可以在某種程度上替代一些人的工作了。以ChatGPT來(lái)說(shuō),目前它天然的模型是有一些缺陷的。比如,如果你去使用真的ChatGPT,它經(jīng)常會(huì)一本正經(jīng)的“胡說(shuō)八道”,這個(gè)現(xiàn)象是很普遍的。
我們都知道作為人類,一個(gè)人對(duì)信息的判別和過(guò)濾,很多人連網(wǎng)絡(luò)上各種虛假信息都不具備真假的辨別能力,我們跟AI對(duì)話當(dāng)中得到的信息,我們?cè)趺粗浪钦媸羌?,這是目前的一個(gè)很大的問(wèn)題。而這個(gè)問(wèn)題至少在目前的ChatGPT技術(shù)架構(gòu)上是無(wú)法解決的。同時(shí),因?yàn)樗F(xiàn)在整個(gè)模型的知識(shí),官方說(shuō)截至2021年。假設(shè)實(shí)時(shí)的新產(chǎn)生的知識(shí)它不知道的時(shí)候,必然有一些時(shí)效性的知識(shí)它是有可能“胡說(shuō)八道”的。所以,當(dāng)AIGC產(chǎn)生的大量?jī)?nèi)容和人類產(chǎn)生大量的內(nèi)容,融合在一起的時(shí)候,在很大程度上,你是很難很快去區(qū)分的,不管是文字還是圖片。
第二,我們可以在產(chǎn)品上,把一些實(shí)時(shí)的結(jié)果跟ChatGPT的對(duì)話結(jié)果融合在一起。就像谷歌前幾天的發(fā)布會(huì),雖然它的Bard在發(fā)布的時(shí)候回答錯(cuò)了一些問(wèn)題。但是實(shí)際上,如果說(shuō)我們真的去用ChatGPT就知道,ChatGPT回答錯(cuò)的問(wèn)題更是多了去了,所以我不認(rèn)為谷歌的技術(shù)就比不上OpenAI,做不出類似的東西。反而是因?yàn)樗乃阉鞲采w的用戶群過(guò)于巨大,它在產(chǎn)品上做一個(gè)小的修改,很有可能會(huì)引起數(shù)以億計(jì)的用戶習(xí)慣的改變,以及影響到它數(shù)十億美金的收入。所以它和OpenAI的地位是不太一樣的,它必然就會(huì)束手束腳,這是一個(gè)很重要的原因。
總的來(lái)說(shuō),AIGC實(shí)際上已經(jīng)進(jìn)入生產(chǎn),已經(jīng)可以滿足我們低階的需求,但是要看你怎么用。實(shí)際上我知道的一些團(tuán)隊(duì),包括我所在的團(tuán)隊(duì),都已經(jīng)把AIGC的內(nèi)容導(dǎo)入了工作流,做某個(gè)方面的優(yōu)化。我相信很多的AIGC的產(chǎn)品,它現(xiàn)在在輔助人類的工作,以及替代人類的局部工作,這個(gè)現(xiàn)象已經(jīng)在產(chǎn)生,而歷史的車(chē)輪是不可阻擋的。
但也正如前面我提到,ChatGPT現(xiàn)在產(chǎn)生的很多內(nèi)容,對(duì)于精準(zhǔn)性、正確性來(lái)說(shuō),是有很大的缺陷的,這個(gè)影響如果說(shuō)貫穿到很多的行業(yè)里,也可能帶來(lái)對(duì)社會(huì)的一些負(fù)面影響,所以很多技術(shù),在使用過(guò)程當(dāng)中,我們既要擁抱它的變化,既要善于使用工具,同時(shí)也要能夠控制工具,這是我的觀點(diǎn)。
主持人:像AIGC應(yīng)用,包括ChatGPT,目前需要的算力并不低,如何平衡算力成本和商業(yè)變現(xiàn)之間的關(guān)系?對(duì)于AIGC而言,如何打造一個(gè)長(zhǎng)期的商業(yè)模式或價(jià)值?
李豐:首先算力這個(gè)問(wèn)題,在某種程度上,隨著時(shí)間的推移,成本肯定會(huì)下降。因?yàn)槲覀兌贾?,GPU一直是號(hào)稱超越摩爾定律算力的發(fā)展,因此,我覺(jué)得某種程度上,算力的成本會(huì)隨著時(shí)間的推移、半導(dǎo)體技術(shù)的發(fā)展,這是一個(gè)降低的維度。另外一個(gè)維度是說(shuō)算法的改進(jìn),效率的提升,包括一些壓縮模型的提出和使用,也會(huì)使得成本有一個(gè)降低的維度。
商業(yè)模式這一點(diǎn),我認(rèn)為芯片廠商,可能是吃到AIGC這一波大紅利的廠商。因?yàn)樗麄兪腔A(chǔ)設(shè)施的提供者,幾乎所有的AIGC算力,現(xiàn)在都是GPU在提供,尤其是在訓(xùn)練方面。另外一類,比如說(shuō)云廠商,同樣作為基礎(chǔ)設(shè)施提供者,會(huì)推出大量的GPU云,以降低GPU部署的門(mén)檻。我認(rèn)為這兩類廠商,相對(duì)來(lái)說(shuō),商業(yè)模式比較清楚,它的盈利的點(diǎn),包括商業(yè)模式的建立比較清晰,可以得到保障。?
同時(shí),現(xiàn)在產(chǎn)生出一種新的模式,有的把它叫做MaaS,也就是說(shuō)模型即服務(wù)。有很多的廠商把自己預(yù)訓(xùn)練好的大模型開(kāi)源出來(lái),這些大模型如果你本機(jī)用還可以,但是要把它作為一個(gè)服務(wù)提供出去的時(shí)候,就需要算力托管。所以如果說(shuō)把大模型加上算力托管做成中間件,提供很多標(biāo)準(zhǔn)的、可調(diào)度、可管理的API對(duì)外提供,我相信這又是另外一種商業(yè)模式,會(huì)有不少?gòu)S商在這一層上做。?
但是因?yàn)樗懔Φ漠a(chǎn)生,算力由中間件到應(yīng)用開(kāi)發(fā)商,最后到用戶付費(fèi)這個(gè)管道,因?yàn)椴煌脩舾顿M(fèi)的意愿和付費(fèi)的能力是不一樣的,假設(shè)你開(kāi)發(fā)的只是一個(gè)玩具,寫(xiě)寫(xiě)古詩(shī)詞,你可能用戶量很大,但是大部分人不會(huì)付費(fèi),最多有的人會(huì)愿意付你幾塊錢(qián)的訂閱費(fèi),這要覆蓋算力成本幾乎不可能。但如果把AIGC很多成果和生產(chǎn)力對(duì)接,能夠解決很多具體的問(wèn)題,很多行業(yè)里的垂直用戶是愿意為這些具體的問(wèn)題付出高昂費(fèi)用的。所以目前看起來(lái),我看應(yīng)用級(jí)別,已經(jīng)產(chǎn)生了比較大收入的,因此這也是一類商業(yè)模式。
還有一類是用AIGC文本生成,去做產(chǎn)品評(píng)測(cè)的文檔,大規(guī)模的發(fā)出去引流,然后把流量拿來(lái)變現(xiàn),這一類廠商有一些收入也不錯(cuò)。從另外一個(gè)角度來(lái)說(shuō),一大堆AI產(chǎn)生的內(nèi)容,在互聯(lián)網(wǎng)上作為引流信息,可能人也不怎么看,實(shí)際上在互聯(lián)網(wǎng)上本身也是一個(gè)商業(yè)模式,所以這個(gè)商業(yè)模式也是一類。
總而言之,我認(rèn)為基礎(chǔ)設(shè)施、中間件、算力托管、云服務(wù)廠商,這些相對(duì)來(lái)說(shuō)隨著時(shí)間的推移,盈利模式會(huì)比較容易,但是應(yīng)用開(kāi)發(fā)商還有很長(zhǎng)的路要走,至少目前世界上最火的ChatGPT,現(xiàn)階段肯定是嚴(yán)重虧損的,所以什么時(shí)候能夠達(dá)到真正的盈利這一點(diǎn),有待觀察。
主持人:AIGC如果要大規(guī)模應(yīng)用,它成功的必備因素有哪些?目前國(guó)內(nèi)AIGC的發(fā)展現(xiàn)狀如何?與ChatGPT的差距在哪里?
李豐:任何技術(shù)從誕生到成熟,到真正的得到應(yīng)用,它是有一個(gè)很長(zhǎng)的時(shí)間周期的。ChatGPT今天有這樣的成果,并不是突然冒出來(lái)的,因?yàn)镺penAI經(jīng)歷了很長(zhǎng)一個(gè)過(guò)程,它作為一個(gè)非營(yíng)利性組織,到相對(duì)商業(yè)化運(yùn)作,這個(gè)時(shí)間是非常長(zhǎng)的。而且ChatGPT本身也是經(jīng)過(guò)了GPT1、GPT2、GPT3,包括它是在GPT3.5上加入了很多人類反饋的微調(diào)才產(chǎn)生的,它的整個(gè)誕生過(guò)程是相當(dāng)漫長(zhǎng)的。所以,任何在這個(gè)領(lǐng)域里想深耕的企業(yè),它是需要有很長(zhǎng)的技術(shù)積淀的。
目前,從我個(gè)人觀察來(lái)看,國(guó)內(nèi)網(wǎng)絡(luò)上,以ChatGPT為名的,各種各樣的微信機(jī)器人、網(wǎng)絡(luò)的應(yīng)用,相當(dāng)大一部分和ChatGPT沒(méi)有什么關(guān)系。很多行業(yè)做的事情只要能沾點(diǎn)邊,就拼命往ChatGPT上去靠。在我看來(lái),并不是說(shuō)今天有一家公司說(shuō),ChatGPT很熱,馬上要做就可以成功。
第一個(gè)因素是資金。雖然說(shuō)ChatGPT沒(méi)有公布GPT3.5的參數(shù),但是GPT3的參數(shù)量高達(dá)1750億,數(shù)據(jù)量也達(dá)到了45TB,從一些數(shù)據(jù)來(lái)看,它動(dòng)用的GPU訓(xùn)練算力是世界上最高端的GPU芯片,而且是成千上萬(wàn)張來(lái)進(jìn)行訓(xùn)練,所以訓(xùn)練一次的成本相當(dāng)昂貴。所以很多小型團(tuán)隊(duì)如果說(shuō)沒(méi)有足夠的資金,這件事情至少目前無(wú)法實(shí)現(xiàn)。
第二因素是原創(chuàng)性。我們必須得承認(rèn),在人工智能方面很多的原創(chuàng)模型和原創(chuàng)算法,目前很多還是來(lái)自于硅谷的團(tuán)隊(duì),其實(shí)ChatGPT也不是從零開(kāi)始的,它的很多模型也是來(lái)自于其他,比如說(shuō)它使用了谷歌的Transformer,所以說(shuō)ChatGPT也是站在全世界很多個(gè)科學(xué)家以及很多企業(yè),包括很多的開(kāi)源貢獻(xiàn)者的肩膀上才出現(xiàn)的。目前,國(guó)內(nèi)很多企業(yè)也運(yùn)用了開(kāi)源,比如GPT2是開(kāi)源的,BERT是開(kāi)源的,在一些開(kāi)源模型上,做一些調(diào)整,產(chǎn)生出一些應(yīng)用,不是說(shuō)這個(gè)方法不好,但是實(shí)際上,我們還是在前人很多的技術(shù)基礎(chǔ)上來(lái)進(jìn)行修改,我們并沒(méi)有誕生出在AIGC方面原創(chuàng)性的成果,我們必須要承認(rèn)這個(gè)差距是在的。
當(dāng)然,國(guó)內(nèi)近期有一些大的企業(yè),比如說(shuō)百度、阿里等廠商,已宣布將發(fā)布類似于ChatGPT的產(chǎn)品戰(zhàn)略或者是產(chǎn)品的體驗(yàn)。我相信這些國(guó)內(nèi)的大廠,因?yàn)橛泻荛L(zhǎng)時(shí)間的技術(shù)積淀,也有大量的數(shù)據(jù)積淀,也有足夠雄厚的資金和足夠多的工程師,所以,我很期待國(guó)內(nèi)AIGC在接下來(lái)的時(shí)間里陸續(xù)亮相。
主持人:算力是AIGC應(yīng)用背后的關(guān)鍵,AIGC對(duì)算力有哪些需求?企業(yè)若想大力發(fā)展AIGC,在算力方面方面應(yīng)該做哪些部署?
李豐:我們今天做一個(gè)AI應(yīng)用的部署,實(shí)際上就像造車(chē)一樣,我們不是從種一棵橡膠樹(shù)開(kāi)始的,而是基于很多前人的技術(shù)成果上來(lái)搭建我們自己的應(yīng)用。我們必須基于很多開(kāi)源生態(tài)當(dāng)中的成果來(lái)做,所以就不得不使用同樣算力平臺(tái)來(lái)做這件事情。
我們也看見(jiàn)有一些AI專用芯片在某些專門(mén)算法上優(yōu)于GPU,但是AI模型和算法迭代的速度非???,而針對(duì)專用算法優(yōu)化的特定芯片,如果說(shuō)現(xiàn)在部署,很可能到用上那一天,這個(gè)算法已經(jīng)落后了,所以為了兼顧靈活度和應(yīng)用開(kāi)發(fā)的算力,目前來(lái)看全功能GPU更適合?;蛟S將來(lái),在推理尤其是邊緣端的推理上,可能會(huì)有一些專用的SoC可以用于在推理方面的很多應(yīng)用。事實(shí)上,包括現(xiàn)在,在邊緣推理上,其實(shí)已經(jīng)有一些專門(mén)的SoC在圖像識(shí)別等領(lǐng)域得到了應(yīng)用。
因此,我個(gè)人認(rèn)為,將來(lái)的生態(tài),基本上會(huì)以GPU為主,輔以其他種類芯片的生態(tài)。所以,假設(shè)今天要部署算力集群,首先要有一個(gè)明確的目標(biāo),我到底要做什么?我需要跟OpenAI去PK大語(yǔ)言嗎?這時(shí)候就要先評(píng)估自己的資金有多少億打底,如果有看OpenAI發(fā)表的一些文章和訪談就知道,有很大一筆費(fèi)用,他們用于購(gòu)買(mǎi)GPU。而且買(mǎi)來(lái)了GPU,還要有運(yùn)維、管理、算力部署,需要一個(gè)團(tuán)隊(duì)來(lái)運(yùn)營(yíng),所以要做什么,決定了你要投入多少在算力部署上。
同時(shí),我認(rèn)為現(xiàn)在,尤其對(duì)于很多小型團(tuán)隊(duì),肯定要想清楚自己要做什么,因?yàn)锳IGC是一個(gè)工具,最終要解決人類的某些問(wèn)題,所以我更認(rèn)為,為你要解決的某些問(wèn)題來(lái)做算力的部署規(guī)劃,然后同時(shí)有一部分自己本地的小型算力部署,結(jié)合一些GPU算力云的算力調(diào)用,有可能隨著用戶的多少或者是計(jì)算任務(wù)種類的變化,你需要一個(gè)彈性可變的算力,所以需要一種混合部署的方法,包括很多企業(yè)在做AIGC時(shí),基本上也是采用這樣的方式。此外,對(duì)于個(gè)人而言,也有一些模型是可以在本地計(jì)算機(jī)上部署的,當(dāng)然這些模型部署下來(lái),需要的也是本地GPU。因此,在算力部署這個(gè)話題上,無(wú)論你從哪一個(gè)角度去看,都繞不開(kāi)GPU。
主持人:ChatGPT可以說(shuō)是AIGC當(dāng)中的一個(gè)爆款,摩爾線程也有自己的AIGC平臺(tái),咱們?cè)陂_(kāi)發(fā)的過(guò)程中遇到最大的困難和挑戰(zhàn)是什么?從ChatGPT的發(fā)展上是否得到什么啟示?未來(lái)希望怎么落地?
李豐:首先,摩爾線程部署自己的AIGC平臺(tái),這件事情很久以前就在做了。我們跟很多其他廠商不同,我們?cè)谕瞥龇?wù)的時(shí)候,要必須讓所有的應(yīng)用都部署在自己的GPU上,要把現(xiàn)在豐富多樣的模型以及生態(tài),在我們GPU上運(yùn)行起來(lái),這背后還涉及了很多技術(shù)問(wèn)題??偟膩?lái)說(shuō),摩爾線程作為一個(gè)算力提供者,我們希望能夠幫助應(yīng)用開(kāi)發(fā)商擁有一個(gè)從端到端的硬件到軟件棧的一套整體解決方案,包括我們也推出了算力底座MCCX元計(jì)算一體機(jī),專為元宇宙應(yīng)用構(gòu)建的MTVERSE元宇宙平臺(tái),可以把上層SDK工具提供給開(kāi)發(fā)者,實(shí)現(xiàn)AIGC內(nèi)容生成等一系列功能,進(jìn)一步簡(jiǎn)化應(yīng)用和解決方案的開(kāi)發(fā)周期和難度。
所以,我們做AIGC平臺(tái),不是簡(jiǎn)單做一個(gè)應(yīng)用開(kāi)發(fā),把應(yīng)用開(kāi)放出來(lái)給消費(fèi)者使用就可以了,我們要兼顧要做的事情,遠(yuǎn)比單純的應(yīng)用開(kāi)發(fā)商更復(fù)雜,而且做GPU最難的是生態(tài)的建立,我們要兼顧很多的生態(tài)兼容性,比如全功能GPU做多模態(tài)生成,對(duì)于各種視頻格式的編解碼,作為科學(xué)計(jì)算的使用,包括AI訓(xùn)練和推理,包括要展現(xiàn)出圖形的三維的、二維的各種渲染。實(shí)際上,我們希望自己的AIGC平臺(tái),運(yùn)行在自己的GPU上,能夠展示出摩爾線程研發(fā)了一個(gè)真正的全功能GPU,能夠在AIGC領(lǐng)域?qū)芏囝愋偷膬?nèi)容生成都進(jìn)行良好的支持。
除此之外,我們開(kāi)發(fā)的AIGC平臺(tái),也在去年11月發(fā)布會(huì)首次亮相,它叫摩爾線程“馬良”,我們內(nèi)部已經(jīng)內(nèi)測(cè)了很長(zhǎng)一段時(shí)間,現(xiàn)在還在不斷迭代和增加功能過(guò)程當(dāng)中。今年之內(nèi),我們陸續(xù)會(huì)有一些AIGC的成果給大家展現(xiàn)。
此外,摩爾學(xué)院院長(zhǎng)李豐還帶來(lái)《全功能GPU是AIGC的算力底座》的主題分享,以下是經(jīng)過(guò)整理的現(xiàn)場(chǎng)實(shí)錄:
最近大熱的話題ChatGPT在AIGC(AI Generated Content)的C當(dāng)中,屬于自然語(yǔ)言的本文生成,包括前一段時(shí)間流行的文本生成圖像,這些類別我們都統(tǒng)稱為AIGC,實(shí)際上就是用人工智能來(lái)生成各種類型的內(nèi)容,包括文本、圖像、音樂(lè)、視頻、三維模型等,而且還會(huì)涵蓋面越來(lái)越廣。
其實(shí)不管是ChatGPT,還是基于文本的圖像生成,它們都有一個(gè)底層邏輯,所有這一切都是計(jì)算能力產(chǎn)生的內(nèi)容,而這個(gè)算力是現(xiàn)在幾乎AIGC都采用的算力——GPU。那么,為什么最終的內(nèi)容生成都依賴GPU?
首先,GPU為現(xiàn)代科技當(dāng)中需要算力的地方提供了重要支撐,比如大家熟悉的圖像識(shí)別、自動(dòng)駕駛的訓(xùn)練、包括推薦算法等領(lǐng)域,以及科學(xué)計(jì)算、高清視頻編解碼,這些很多需要算力的領(lǐng)域。今天,全世界和中國(guó)主要增長(zhǎng)算力的來(lái)源都是來(lái)自于GPU,而AIGC是通過(guò)人工智能的模型,通過(guò)一些算法來(lái)產(chǎn)生出內(nèi)容,這些內(nèi)容的種類多種多樣,其產(chǎn)生的機(jī)理,大多數(shù)先要?dú)v經(jīng)一個(gè)訓(xùn)練過(guò)程,這個(gè)過(guò)程中需要大量的數(shù)據(jù),這些數(shù)據(jù)需要在非常龐大的GPU集群上進(jìn)行訓(xùn)練,訓(xùn)練完成之后,又部署到GPU的集群上,然后大家在使用當(dāng)中,它是一個(gè)推理的過(guò)程。
所以,今天所有的AIGC都繞不開(kāi)的一個(gè)話題,它們的算力底座都來(lái)自于全功能GPU,而且我們都知道,ChatGPT主要是文本生成,還有很多人用ChatGPT生成的文本也去生成圖像。這個(gè)過(guò)程不管是生成圖像、視頻還是三維模型,又需要另外一種計(jì)算方法,比如生成高清視頻,需要視頻編解碼;生成音樂(lè),需要音頻的編解碼;三維模型需要三維的渲染,所以所有的這一切,就使得GPU成了這個(gè)浪潮當(dāng)中基礎(chǔ)設(shè)施的提供者。
我們都知道,所有的人工智能算法是在不斷進(jìn)步和迭代的,GPU兼顧了靈活度以及計(jì)算能力,它是屬于芯片行業(yè)的“圣杯”。摩爾線程作為一家以全功能GPU芯片設(shè)計(jì)為主的創(chuàng)新型企業(yè),我們也有在AIGC方面的布局。實(shí)際上,我們已經(jīng)在內(nèi)部測(cè)試,一個(gè)完全部署在摩爾線程全功能GPU上的AIGC平臺(tái),不久就會(huì)跟大家見(jiàn)面,它包括了圖像生成、自然語(yǔ)言生成等一系列的多模態(tài)內(nèi)容生成平臺(tái)。?
當(dāng)然,我們也希望隨著技術(shù)的進(jìn)步,GPU可以為接下來(lái)的AIGC帶來(lái)很大的助力。所以總的來(lái)看,GPU作為AIGC的核心發(fā)動(dòng)機(jī),以及算力的提供者和算力服務(wù)的支撐者,摩爾線程可能跟目前市場(chǎng)上做AIGC的一些企業(yè)定位不同,我們相當(dāng)于屬于整個(gè)產(chǎn)業(yè)的基礎(chǔ)設(shè)施的提供商,也希望為中國(guó)AIGC發(fā)展及相關(guān)算力應(yīng)用提供強(qiáng)大且易用、堅(jiān)實(shí)的算力底座。?
? 編輯:黃飛
?
評(píng)論
查看更多