科技云報到原創(chuàng)。
2024年的大模型產(chǎn)業(yè),注定將是會被反復(fù)提起的一頁。
這一年,被按下加速鍵的市場剛剛過半,就已經(jīng)顯示出冰火兩重天的格局。算法的單模態(tài)擴展到多模態(tài),趨勢如燎原之火,讓全球陷入對世界模型暢想的狂歡中;一級市場逐漸走向冷靜,投資人開始頻頻向企業(yè)要收入,百模齊發(fā)迅速被簡化為幾家獨角獸之間的資本與技術(shù)持久戰(zhàn)。
云服務(wù)巨頭則以一種標(biāo)準(zhǔn)制定者,以及頂級大模型團隊背后力量的角色出現(xiàn),成為市場中隱形的力量。在他們的主導(dǎo)下,過去IaaS、PaaS、SaaS的角色分工,在AI時代被芯片層、框架層、模型層和應(yīng)用層取代,又迅速進化為基礎(chǔ)設(shè)施、工具和應(yīng)用的新“三層架構(gòu)”。
技術(shù)的發(fā)展,基礎(chǔ)設(shè)施的成熟,讓千行百業(yè)都產(chǎn)生了所有生意都值得在大模型時代重做一遍的信仰。
但如何低成本、高質(zhì)量的重新做一遍,是所有企業(yè),必須回答的關(guān)鍵問題。
從“業(yè)務(wù)靠近技術(shù)”到“技術(shù)靠近業(yè)務(wù)”
如今,“AI轉(zhuǎn)型”正逐步取代“云轉(zhuǎn)型”,成為IT行業(yè)的新趨勢,AI也已成為硅谷最具想象力的概念。
2025年,是大模型落地的關(guān)鍵年。一方面,大模型Scaling Law的曲線趨緩,基礎(chǔ)模型廠商開始收斂,基礎(chǔ)模型動輒一次數(shù)億美元的投入,以及不斷推高的人才密度等高門檻,意味著只有少數(shù)企業(yè)能夠留在牌桌。
另一方面,大模型落地的緊迫感前所未有,大家都期待大模型產(chǎn)生實實在在的價值,且超出以往的技術(shù)能力范疇,全行業(yè)都在默契又統(tǒng)一地走向落地。
在ChatGPT爆發(fā)的初期,似乎是由新技術(shù)創(chuàng)造了新的市場,但是,并非所有的企業(yè)都需要一個ChatGPT,而所有企業(yè)都需要生成式AI。革命性技術(shù)發(fā)展的早期看起來是從無到有,在成熟期則是從“業(yè)務(wù)靠近技術(shù)”走向“技術(shù)靠近業(yè)務(wù)”,大模型越往后發(fā)展越需要對行業(yè)的理解、對產(chǎn)業(yè)的專耕。
對于企業(yè)來說,要直接將大模型運用好難度較大,畢竟大模型的復(fù)雜性、對技術(shù)能力和資源等方面的要求較高;而如果拋開行業(yè)化這一環(huán)節(jié),直接去基于大模型開發(fā)具體應(yīng)用,距離又太過遙遠,缺乏有效的銜接過渡。
其中的關(guān)鍵就是技術(shù)和行業(yè)結(jié)合,在當(dāng)下的生成式AI產(chǎn)業(yè)敘事邏輯中,比以往任何時候都需要“行業(yè)化”。行業(yè)化起著降低大模型技術(shù)落地門檻的重要作用,它能夠聚焦提煉出各個行業(yè)普遍存在的共性難題,進而為大模型更好地適配不同行業(yè)提供基礎(chǔ)。
相比于新技術(shù)落地的其他環(huán)節(jié),行業(yè)化是一個容易被忽略的部分,卻又往往需要最專業(yè)的廠商投入大量的資源做具體的事,大多數(shù)企業(yè)享受了行業(yè)化帶來的便利,卻對大模型落地這一層級的變化感受不明顯。
事實上,以ChatGPT為代表的生成式AI技術(shù)興起的近兩年,業(yè)內(nèi)普遍關(guān)心AI應(yīng)用的爆發(fā)時間。但從任何高科技行業(yè)發(fā)展的歷史來看,但凡應(yīng)用要爆發(fā),就離不開“降本”這一要素。
模型價格決定了應(yīng)用使用成本,因為用戶使用應(yīng)用會調(diào)用大模型,需要消耗Token,而大模型訓(xùn)練和推理的成本高,API的調(diào)用成本就會高,從而限制企業(yè)用戶、開發(fā)者的應(yīng)用開發(fā)步伐。
這就迫使大模型廠商,一方面要不斷迭代大模型,在百模大戰(zhàn)中以能力勝出;另一方面要降本提效,通過模型機構(gòu)優(yōu)化、分布式推理和混合調(diào)度等手段進行優(yōu)化、大幅壓縮成本,來不斷降低API調(diào)用價格,推動應(yīng)用興起。
隨著AI技術(shù)的普及和深入應(yīng)用,云廠商也面臨著越來越多的挑戰(zhàn)。一方面,企業(yè)需要更加定制化、差異化的AI解決方案來滿足其獨特的業(yè)務(wù)需求;另一方面,AI技術(shù)的復(fù)雜性和不確定性也使企業(yè)在應(yīng)用過程中面臨諸多風(fēng)險。
與五六年前相比,當(dāng)前AI行業(yè)正在發(fā)生根本性轉(zhuǎn)變,其中最明顯的趨勢是,生成式AI的廣泛應(yīng)用使業(yè)務(wù)部門成為技術(shù)創(chuàng)新的重要推動力,企業(yè)希望通過AI技術(shù)來解決實際問題、提升業(yè)務(wù)效率。
而這也驅(qū)使云廠商在業(yè)務(wù)開展方面出現(xiàn)了一系列新的變革。在AIGC時代,如何積極響應(yīng)用戶需求,通過提供開箱即用的數(shù)據(jù)分析能力幫助企業(yè)快速接入AI技術(shù),成為這個時代云廠商需要思考的難題。
在模型開發(fā)方面,云廠商需要思考如何提升模型落地的工廠化能力,降低硬件成本、提高硬件性能,為企業(yè)提供更加穩(wěn)定、高效的AI運行環(huán)境。
其中,把握并識別企業(yè)需求是一大難點。企業(yè)往往只會提出諸如需要更快、更便宜的GPU這類直觀需求,但不會透露更深層次的具體需求,如何運用創(chuàng)新辦法來解決相應(yīng)需求是一大痛點。
為千行百業(yè)開啟數(shù)字化新篇章
當(dāng)前,云服務(wù)商的競爭已經(jīng)從技術(shù)維度延展到企業(yè)的實際業(yè)務(wù)需求方面,這也成為亞馬遜云科技在AI上的布局重點之一。
在re:Invent 2024全球大會期間,亞馬遜云科技不僅展示了其在生成式AI領(lǐng)域的深厚積累,更通過一系列新發(fā)布,展示了從模型到應(yīng)用的全面布局。
作為亞馬遜云科技推出的新一代基礎(chǔ)模型,Amazon Nova旨在為用戶提供多模態(tài)、高性能且成本效益顯著的生成式AI解決方案。該系列包括Micro、Lite、Pro、Premier等多個版本,分別適用于不同場景下的需求。Micro作為文本到文本的模型,以極低成本提供低延遲響應(yīng);Lite則為成本極低的多模態(tài)模型,可快速處理多種輸入;Pro在準(zhǔn)確性、速度和成本間取得平衡,滿足多種復(fù)雜需求;而Premier則將是功能最為強大的多模態(tài)模型,可處理復(fù)雜推理任務(wù)并指導(dǎo)定制模型蒸餾。
除了基礎(chǔ)模型外,亞馬遜云科技還推出了新一代圖像生成模型Amazon Nova Canvas和視頻生成模型Amazon Nova Reel。Canvas能夠幫助客戶生成高質(zhì)量圖像,并具備圖像編輯功能,最高可生成2K分辨率的圖像;Reel則以先進的視頻生成質(zhì)量和低延遲著稱,提供了性能和成本效益之間的平衡,讓視頻制作更加普惠化。
為更好地支持生成式AI應(yīng)用的構(gòu)建與擴展,亞馬遜云科技推出了Amazon Bedrock平臺。該平臺提供了從模型選擇、推理優(yōu)化到多智能體協(xié)作等一系列工具和服務(wù),旨在幫助用戶輕松地將生成式AI能力整合到生產(chǎn)環(huán)境中。
在模型選擇方面,Amazon Bedrock Marketplace匯聚了來自領(lǐng)先供應(yīng)商的100多個新興和專業(yè)基礎(chǔ)模型,用戶可以通過統(tǒng)一界面發(fā)現(xiàn)、測試并部署所需模型。在推理優(yōu)化方面,Amazon Bedrock推出了延遲優(yōu)化選項和模型蒸餾功能,前者基于Amazon EC2 Trn2實例實現(xiàn)更好的推理性能,后者則通過蒸餾技術(shù)提升模型運行速度和降低成本。
此外,Amazon Bedrock還支持GraphRAG和自動推理檢查功能,分別用于提升數(shù)據(jù)關(guān)聯(lián)性和預(yù)防模型幻覺引起的事實性錯誤。
除了技術(shù)和工具的創(chuàng)新外,亞馬遜云科技還通過Amazon Q系列產(chǎn)品加速了生成式AI在業(yè)務(wù)場景中的應(yīng)用。Amazon Q Developer和Amazon Q Business分別為開發(fā)人員和企業(yè)用戶提供了強大的生成式AI助手功能。
從行業(yè)戰(zhàn)略角度看,亞馬遜云科技的首要目標(biāo)是利用領(lǐng)先的云計算、生成式AI和機器學(xué)習(xí)技術(shù),賦能各行業(yè)客戶構(gòu)建業(yè)內(nèi)創(chuàng)新解決方案。
亞馬遜云科技正在通過多種方式將這一目標(biāo)變?yōu)楝F(xiàn)實。比如,目前亞馬遜云科技已推出超過40種針對特定行業(yè)的專屬服務(wù),以及450多個行業(yè)專屬解決方案。通過這些定制化服務(wù)與解決方案,亞馬遜云科技助力各種規(guī)模的企業(yè)加速應(yīng)用云計算并降低成本,賦能行業(yè)專屬的工作負(fù)載。這些解決方案正以前所未有的速度推動組織創(chuàng)新,助力客戶實現(xiàn)突破性里程碑,并為其所在行業(yè)帶來創(chuàng)新性成果。
同時,亞馬遜云科技助力企業(yè)加速開啟上云之旅,其重點領(lǐng)域涵蓋關(guān)鍵系統(tǒng)的遷移和現(xiàn)代化、將本地數(shù)據(jù)工作負(fù)載遷移上云,以及滿足各行業(yè)的業(yè)務(wù)需求。通過聚焦這些核心領(lǐng)域,亞馬遜云科技幫助各行業(yè)客戶降低成本(基礎(chǔ)設(shè)施成本最多可減少66%)、提升運營效率(開發(fā)人員生產(chǎn)力最多可提高30%)、加速創(chuàng)新步伐,同時應(yīng)對復(fù)雜挑戰(zhàn)并提高可持續(xù)性。
生成式AI是亞馬遜云科技的另一項重要戰(zhàn)略之一。對此,亞馬遜云科技與各行業(yè)企業(yè)攜手合作,通過提供企業(yè)級安全與隱私保護、多種領(lǐng)先基礎(chǔ)模型的選擇、堅持?jǐn)?shù)據(jù)優(yōu)先的方法,以及高性能、低成本的基礎(chǔ)設(shè)施,助力生成式AI創(chuàng)新應(yīng)用加速落地,充分釋放生成式AI的變革潛力。
比如在醫(yī)療領(lǐng)域,亞馬遜云科技提供為醫(yī)療行業(yè)設(shè)計的專屬服務(wù)、企業(yè)級安全保障以及符合HIPAA標(biāo)準(zhǔn)的工具組件,包括可用于自動生成臨床文檔的Amazon HealthScribe、增強臨床問題解決能力的Amazon Q、可自動將醫(yī)療語音轉(zhuǎn)換為文本的Amazon Transcribe Medical,以及準(zhǔn)確、快速地從非結(jié)構(gòu)化醫(yī)學(xué)文本中提取信息的Amazon Comprehend Medical,從而為客戶轉(zhuǎn)型提供全面的技術(shù)支持。
在制造業(yè)和工業(yè)領(lǐng)域,亞馬遜云科技獲評2024年Gartner?全球工業(yè)物聯(lián)網(wǎng)平臺魔力象限領(lǐng)導(dǎo)者。亞馬遜云科技的工業(yè)物聯(lián)網(wǎng)服務(wù)套件包括Amazon IoT SiteWise和Amazon Lookout for Equipment,能夠助力制造企業(yè)徹底革新其運維流程。Coca-Cola ??ecek(CCI)以Coca-Cola品牌生產(chǎn)、分銷、銷售起泡飲料和不充氣飲料,該公司通過使用Amazon IoT SiteWise,顯著提升了其“原位清洗(Clean in Place, CIP)”流程的可持續(xù)性,實現(xiàn)了每年能源消耗降低20%、水資源節(jié)約9%,以及流程時間縮短34天的顯著成效。
亞馬遜云科技全球客戶技術(shù)支持與服務(wù)副總裁Uwem Ukpong表示:“在幫助客戶構(gòu)建生成式AI解決方案的過程中,我們發(fā)現(xiàn)企業(yè)選擇的生成式AI應(yīng)用場景也在逐漸迭代升級,從原先簡單的生成式AI嘗試?yán)鐚υ捠搅奶?a href="http://www.wenjunhu.com/soft/data/42-101/" target="_blank">機器人,過渡到內(nèi)容、圖像、視頻等多媒體內(nèi)容生成,以及數(shù)據(jù)洞察與決策等。亞馬遜云科技將從客戶需求出發(fā),滿足客戶不同應(yīng)用場景的痛點與訴求,助力客戶構(gòu)建數(shù)字化解決方案?!?/p>
在生成式AI的淺水區(qū),重點是找到新技術(shù)應(yīng)用于業(yè)務(wù)的廣度覆蓋;在生成式AI的深水區(qū),重點是彌合新技術(shù)和業(yè)務(wù)的認(rèn)知鴻溝,也就格外需要云平臺企業(yè),做中間一層的行業(yè)化,彌補大模型落地的版圖。
從底層的芯片、云服務(wù),到中間層的模型,再到最上層的應(yīng)用,整個大模型產(chǎn)業(yè)鏈的各個環(huán)節(jié)之間,如同互相嵌合連接的精密傳動儀器,任何一個環(huán)節(jié)的進步與迭代,都會掀起整個市場的漣漪不斷傳導(dǎo)擴散。
其中,云服務(wù)等基礎(chǔ)設(shè)施范式的存在,如同整個板塊的地基。上層的算法應(yīng)用越想改變世界,最底層的地基就要越穩(wěn)固。
盡管基礎(chǔ)大模型的能力提升已將AI應(yīng)用開發(fā)從“最后1公里”推進到“最后100米”,但開發(fā)AI應(yīng)用仍然面臨諸多挑戰(zhàn),這正是云計算平臺從技術(shù)走向服務(wù)的重要意義所在。云計算的進步,也是整個大模型產(chǎn)業(yè)鏈不斷向前飛奔過程中,被極大低估的一環(huán)。在未來生成式AI持續(xù)發(fā)展的進程中,云計算將進一步與之深度融合,助力其釋放出更大潛能,為千行百業(yè)開啟更具想象力的數(shù)字化篇章。
【關(guān)于科技云報到】
企業(yè)級IT領(lǐng)域Top10新媒體。聚焦云計算、人工智能、大模型、網(wǎng)絡(luò)安全、大數(shù)據(jù)、區(qū)塊鏈等企業(yè)級科技領(lǐng)域。原創(chuàng)文章和視頻獲工信部權(quán)威認(rèn)可,是世界人工智能大會、數(shù)博會、國家網(wǎng)安周、可信云大會與全球云計算等大型活動的官方指定傳播媒體之一。
審核編輯 黃宇
-
云計算
+關(guān)注
關(guān)注
39文章
7837瀏覽量
137539 -
AI
+關(guān)注
關(guān)注
87文章
31097瀏覽量
269423 -
人工智能
+關(guān)注
關(guān)注
1792文章
47409瀏覽量
238923
發(fā)布評論請先 登錄
相關(guān)推薦
評論