據(jù)悉,亞馬遜云服務(wù)部門于5月23日宣布,與人工智能新貴Hugging Face達(dá)成合作協(xié)議,在定制化計(jì)算芯片Inferentia2上以更優(yōu)惠價(jià)格運(yùn)行上千種AI模型。
Hugging Face作為一家估值為45億美元的公司現(xiàn)已成為了眾多AI研究員和開發(fā)者分享Chatbot和相關(guān)軟件的核心平臺(tái),受到亞馬遜、谷歌、英偉達(dá)等巨頭的青睞。
據(jù)了解,Hugging Face是開發(fā)者獲取和調(diào)整諸如Meta Platforms的Llama 3等開源AI模型的首選平臺(tái)。
當(dāng)開發(fā)者完成對開源AI模型的調(diào)整后,往往希望能利用此模型驅(qū)動(dòng)軟件。因此,亞馬遜和Hugging Face決定聯(lián)手,通過在Inferentia2定制化亞馬遜網(wǎng)絡(luò)服務(wù)(AWS)芯片上實(shí)現(xiàn)這一目標(biāo)。
Hugging Face的產(chǎn)品及增長主管Jeff Boudier表示,對于他們而言,效率至關(guān)重要——即確保盡可能多的用戶能夠運(yùn)行模型,且以最具性價(jià)比的方式進(jìn)行。
盡管英偉達(dá)在訓(xùn)練模型領(lǐng)域處于領(lǐng)先地位,但AWS堅(jiān)信其芯片有能力以更低成本運(yùn)行已訓(xùn)練好的模型。
AWS人工智能產(chǎn)品負(fù)責(zé)人Matt Wood指出,用戶可能每月僅需訓(xùn)練一次這些模型,而實(shí)際應(yīng)用中,可能需要每小時(shí)對其進(jìn)行數(shù)萬次推理,這正是Inferentia2的獨(dú)特優(yōu)勢所在。
-
AI
+關(guān)注
關(guān)注
87文章
30896瀏覽量
269108 -
模型
+關(guān)注
關(guān)注
1文章
3243瀏覽量
48842 -
英偉達(dá)
+關(guān)注
關(guān)注
22文章
3776瀏覽量
91111 -
亞馬遜
+關(guān)注
關(guān)注
8文章
2666瀏覽量
83361
發(fā)布評論請先 登錄
相關(guān)推薦
評論