0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

亞馬遜推出基于Inferentia芯片的Inf1實(shí)例

汽車(chē)玩家 ? 來(lái)源:芯智訊 ? 作者:芯智訊 ? 2019-12-05 14:31 ? 次閱讀

當(dāng)?shù)貢r(shí)間12月3日,亞馬遜在“AWS re:invent”大會(huì)上正式發(fā)布了自主研發(fā)的第二代基于Arm架構(gòu)的服務(wù)器芯片Graviton2,同時(shí)公布了去年發(fā)布的云端AI推理芯片Inferentia的最新進(jìn)展。

亞馬遜AWS在此次大會(huì)上推出了Inf1實(shí)例,該實(shí)例由Inferentia芯片提供支持,是一個(gè)在云端為AI推理提供支持的實(shí)例,AWS CEO Andy Jassy稱(chēng)之為云中可用的成本最低的推理產(chǎn)品。

Andy Jassy 指出:使用云服務(wù)為AI解決方案提供動(dòng)力的運(yùn)營(yíng)成本絕大多數(shù)來(lái)自推理,而推理芯片可能會(huì)很昂貴,并且要求低延遲和高吞吐量。許多企業(yè)都在模型訓(xùn)練的定制芯片上投入了大量精力,盡管常規(guī) CPU 上已經(jīng)能夠較好地執(zhí)行推理運(yùn)算,但定制芯片的效率明顯更高。“與Nvidia G4實(shí)例相比,Inf1具有更低的延遲,吞吐量將提高3倍,并且每個(gè)實(shí)例的成本降低40%。”

Inferentia芯片還將由Annapurna Labs提供支持,該芯片企業(yè)是2015年被以色列AWS收購(gòu)的。Inferentia芯片擁有4的個(gè)NeuronCore,可以提供128TOPS的算力,而每個(gè)Inf1實(shí)例可以提供2000 TOPS的算力。

與 EC4 上的常規(guī) G4 實(shí)例相比,Inferentia 能夠讓 AWS 帶來(lái)更低的延時(shí)、三倍的吞吐量、且降低 40% 單次的成本。

Inf1實(shí)例目前已經(jīng)上市,并將與PyTorch,MXNet和TensoRFlow集成。不過(guò),目前其僅可在EC2計(jì)算服務(wù)中使用,但明年,Inf1將可以用于EKS實(shí)例和Amazon的SageMaker,來(lái)進(jìn)行機(jī)器學(xué)習(xí)的推理運(yùn)算。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • ARM
    ARM
    +關(guān)注

    關(guān)注

    134

    文章

    9107

    瀏覽量

    367969
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    31097

    瀏覽量

    269429
  • 亞馬遜
    +關(guān)注

    關(guān)注

    8

    文章

    2669

    瀏覽量

    83432
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    NeuroBlade攜手亞馬遜EC2 F2實(shí)例,加速數(shù)據(jù)分析

    數(shù)據(jù)分析加速領(lǐng)域的領(lǐng)航者NeuroBlade,近日宣布與亞馬遜云科技(AWS)最新推出的Amazon Elastic Compute Cloud (Amazon EC2) F2實(shí)例實(shí)現(xiàn)深度集成。這一
    的頭像 發(fā)表于 12-31 11:37 ?196次閱讀

    亞馬遜云科技發(fā)布Amazon Trainium2實(shí)例

    近期,亞馬遜云科技宣布了一項(xiàng)重要更新:基于Amazon Trainium2的全新Amazon Elastic Compute Cloud(Amazon EC2)Trn2實(shí)例現(xiàn)已正式推出。這一創(chuàng)新
    的頭像 發(fā)表于 12-27 14:57 ?235次閱讀

    亞馬遜轉(zhuǎn)向Trainium芯片,全力投入AI模型訓(xùn)練

    ,亞馬遜AWS推出了兩款芯片Inferentia和Trainium。其中,Inferentia主要用于AI推理,而Trainium則專(zhuān)注于
    的頭像 發(fā)表于 12-13 14:14 ?297次閱讀

    亞馬遜云科技宣布Amazon Trainium2實(shí)例正式可用

    亞馬遜云科技推出新一代AI訓(xùn)練芯片Amazon Trainium3 全新Amazon EC2 Trn2實(shí)例采用亞馬遜云科技最新的Traini
    的頭像 發(fā)表于 12-06 09:15 ?185次閱讀
    <b class='flag-5'>亞馬遜</b>云科技宣布Amazon Trainium2<b class='flag-5'>實(shí)例</b>正式可用

    亞馬遜追加40億美元投資,深化與Anthropic戰(zhàn)略合作

    標(biāo)志著雙方將在人工智能模型訓(xùn)練方面展開(kāi)更加緊密的合作,共同探索前沿技術(shù),提升模型性能和效率。 為了支持Anthropic未來(lái)的模型訓(xùn)練和部署,亞馬遜計(jì)劃提供其先進(jìn)的Amazon Trainium和Amazon Inferentia芯片
    的頭像 發(fā)表于 11-26 11:13 ?401次閱讀

    亞馬遜將推新芯片,挑戰(zhàn)英偉達(dá)

    亞馬遜正準(zhǔn)備推出其最新的人工智能芯片,這標(biāo)志著其在半導(dǎo)體技術(shù)方面數(shù)十億美元的投資邁出了重要一步。目標(biāo)是減少對(duì)NVIDIA的依賴(lài),后者目前在AI處理器市場(chǎng)占據(jù)主導(dǎo)地位。亞馬遜的云計(jì)算部門(mén)
    的頭像 發(fā)表于 11-15 01:08 ?278次閱讀
    <b class='flag-5'>亞馬遜</b>將推新<b class='flag-5'>芯片</b>,挑戰(zhàn)英偉達(dá)

    亞馬遜推出最新人工智能芯片

    近日,亞馬遜(Amazon.com)宣布即將推出其最新的人工智能芯片,標(biāo)志著這家大型科技集團(tuán)在半導(dǎo)體領(lǐng)域的又一重大舉措。據(jù)悉,亞馬遜正尋求通過(guò)數(shù)十億美元的半導(dǎo)體投資獲得豐厚回報(bào),并計(jì)劃
    的頭像 發(fā)表于 11-14 15:27 ?263次閱讀

    亞馬遜云科技推出Amazon Lambda SnapStart功能

    亞馬遜云科技推出Amazon Lambda SnapStart,大幅提升Java Lambda函數(shù)啟動(dòng)性能   北京,2024年10月29日 —— 亞馬遜云科技近日宣布,與光環(huán)新網(wǎng)和西云數(shù)據(jù)
    的頭像 發(fā)表于 10-30 10:59 ?283次閱讀

    亞馬遜云科技宣布基于自研Amazon Graviton4的Amazon EC2 R8g實(shí)例正式可用

    北京2024年7月15日?/美通社/ -- 亞馬遜云科技宣布基于自研芯片Amazon Graviton4處理器的Amazon Elastic Compute Cloud (Amazon EC2
    的頭像 發(fā)表于 07-15 16:09 ?390次閱讀

    亞馬遜網(wǎng)絡(luò)服務(wù)即將推出第四代Graviton處理器

    7月10日,雅虎財(cái)經(jīng)獨(dú)家報(bào)道了亞馬遜網(wǎng)絡(luò)服務(wù)(AWS)即將推出的重大技術(shù)進(jìn)展——其第四代Graviton處理器,即Graviton4芯片。這一重要信息由AWS的計(jì)算與人工智能產(chǎn)品管理總監(jiān)拉胡爾·庫(kù)爾卡尼在德克薩斯州奧斯汀的
    的頭像 發(fā)表于 07-10 15:51 ?634次閱讀

    亞馬遜云科技升級(jí)“3+1”合作伙伴戰(zhàn)略 與合作伙伴共赴新征程

    北京2024年5月31日?/美通社/ --?亞馬遜云科技中國(guó)合作伙伴峰會(huì)在上海召開(kāi)。峰會(huì)上,亞馬遜云科技升級(jí)推出“3+1”合作伙伴戰(zhàn)略,聚焦生成式AI、專(zhuān)注行業(yè)和業(yè)務(wù)拓展三大業(yè)務(wù)戰(zhàn)略,
    的頭像 發(fā)表于 06-11 10:05 ?641次閱讀
    <b class='flag-5'>亞馬遜</b>云科技升級(jí)“3+<b class='flag-5'>1</b>”合作伙伴戰(zhàn)略 與合作伙伴共赴新征程

    亞馬遜云科技升級(jí)“3+1”合作伙伴戰(zhàn)略

    亞馬遜云科技近期于上海召開(kāi)了盛大的中國(guó)合作伙伴峰會(huì)。在這次會(huì)議上,亞馬遜云科技正式宣布推出升級(jí)版的“3+1”合作伙伴戰(zhàn)略,旨在通過(guò)聚焦生成式AI、專(zhuān)注行業(yè)和業(yè)務(wù)拓展三大核心領(lǐng)域,以及提
    的頭像 發(fā)表于 06-06 10:50 ?703次閱讀

    亞馬遜推出“Project PI”提升商品質(zhì)量

    近日,亞馬遜為提升顧客滿(mǎn)意度,推出了創(chuàng)新性的“Project PI”(偵探項(xiàng)目)。該項(xiàng)目利用先進(jìn)的生成式AI和計(jì)算機(jī)視覺(jué)技術(shù),為商品質(zhì)量把控提供了強(qiáng)有力的支持。
    的頭像 發(fā)表于 06-06 09:20 ?368次閱讀

    亞馬遜AWS稱(chēng)未停止任何英偉達(dá)芯片訂單

    針對(duì)近期關(guān)于“亞馬遜云計(jì)算部門(mén)暫停訂購(gòu)英偉達(dá)Hopper芯片”的報(bào)道,亞馬遜AWS部門(mén)近日給出了明確回應(yīng)。AWS發(fā)言人表示,公司并未停止任何與英偉達(dá)相關(guān)的訂單。
    的頭像 發(fā)表于 05-22 11:39 ?564次閱讀

    亞馬遜推出電商AI工具

    亞馬遜近日宣布推出了一項(xiàng)創(chuàng)新的電商AI工具,該工具旨在幫助賣(mài)家們更加高效地創(chuàng)建產(chǎn)品詳情頁(yè)面。據(jù)了解,這一AI新功能具備強(qiáng)大的自動(dòng)化能力,能夠基于賣(mài)家提供的關(guān)鍵詞和產(chǎn)品圖片等信息,智能地生成產(chǎn)品標(biāo)題、描述以及其他重要的詳細(xì)信息。
    的頭像 發(fā)表于 03-21 11:45 ?797次閱讀