国产精品高颜值AV,无码毛片免费视频

深度學習（DL）的創(chuàng)新，特別是大語言模型（LLM）的快速發(fā)展，已經(jīng)席卷了整個行業(yè)。深度學習模型的參數(shù)已從數(shù)百萬增加到數(shù)十億，為我們呈現(xiàn)了越來越多激動人心的新能力。它們正在催生新的應用，如生成式AI或醫(yī)療保健和生命科學的高級研究。亞馬遜云科技一直在芯片、服務器、數(shù)據(jù)中心互連和軟件服務等多個方面創(chuàng)新，加速深度學習工作負載的大規(guī)模應用。

亞馬遜云科技在2022 re:Invent 全球大會上，以其最新的自研機器學習推理芯片Amazon Inferentia2為基礎(chǔ)，發(fā)布了AmazonEC2 Inf2系列實例的預覽版。AmazonEC2 Inf2類型實例專門針對全球大規(guī)模運行高性能深度學習推理應用程序，為部署在EC2上的生成式AI應用提供最佳性價比，其中包含GPT-J或開放式預訓練Transformer（OPT）語言模型。

現(xiàn)在，亞馬遜云科技宣布Amazon EC2 Inf2實例正式可用。

Inf2實例是AmazonEC2上首個推理優(yōu)化的實例，支持可擴展的分布式推理，可實現(xiàn)多個inferentia2芯片之間的超高速連接。用戶可以在Inf2實例中跨多個芯片高效部署具有數(shù)千億個參數(shù)的模型。與Amazon EC2 Inf1實例相比，Inf2實例的吞吐量提高4倍，延遲降低10倍。

新Inf2實例的亮點

Inf2實例目前有四種可用實例類型，最高擴展至12個Amazon Inferentia2芯片和192個vCPU配置。在BF16或FP16數(shù)據(jù)類型下，它們能夠提供2.3 petaFLOPS的綜合計算能力，并具有芯片間超高速NeuronLink互連的功能。NeuronLink可在多個Inferentia2芯片上擴展大模型，避免通信瓶頸，實現(xiàn)更高性能的推理。

每個Inferentia2芯片內(nèi)有32 GB的高帶寬內(nèi)存（HBM），最高配置的Inf2 實例可提供高達384 GB的共享加速器內(nèi)存，總內(nèi)存帶寬為9.8 TB/s。對于需要大內(nèi)存支持的的大型語言模型而言，這種帶寬對于支持模型推理尤為重要。

基于專門為深度學習工作負載而構(gòu)建的Amazon Inferentia2芯片的Amazon EC2 Inf2，相比同類實例，單位功率性能高出了50%。

AmazonInferentia2的創(chuàng)新之處

與亞馬遜自研機器學習訓練芯片Amazon Trainium類似，每個Amazon Inferentia2芯片都配有兩個經(jīng)過優(yōu)化的NeuronCore-v2引擎、高帶寬內(nèi)存（HBM）堆棧和專用的集體計算引擎，以便在執(zhí)行多加速器推理時實現(xiàn)計算與通信的并行。

每個NeuronCore-v2都有專為深度學習算法構(gòu)建的標量、向量和張量三種引擎，其中張量引擎針對矩陣運算進行了優(yōu)化；標量引擎針對ReLU（修正線性單元）函數(shù)等元素性操作進行了優(yōu)化；向量引擎針對批處理規(guī)范化或池化等非元素向量運算進行了優(yōu)化。

以下是Amazon Inferentia2芯片和服務器硬件其他創(chuàng)新總結(jié)：

數(shù)據(jù)類型——Amazon Inferentia2 支持多種數(shù)據(jù)類型，包括FP32、TF32、BF16、FP16 和UINT8，用戶可以為工作負載選擇最合適的數(shù)據(jù)類型。它還支持新的可配置FP8（cFP8）數(shù)據(jù)類型，該數(shù)據(jù)類型特別適用于大模型，因為它減少了模型的內(nèi)存占用和I/O 要求。

動態(tài)執(zhí)行和動態(tài)輸入形狀——Amazon Inferentia2 具有支持動態(tài)執(zhí)行的嵌入式通用數(shù)字信號處理器（DSP），因此無需在主機上展開或執(zhí)行控制流運算符。Amazon Inferentia2 還支持動態(tài)輸入形狀，這些形狀對于具有未知輸入張量大小的模型（例如處理文本的模型）至關(guān)重要。

自定義運算符——Amazon Inferentia2支持用C++語言編寫的自定義運算符。Neuron自定義C++運算符使用戶能夠編寫在NeuronCore上天然運行的C++自定義運算符。用戶可以使用標準的PyTorch自定義運算符編程接口將CPU 自定義運算符遷移到Neuron 并實現(xiàn)新的實驗運算符，所有這些都無需對NeuronCore 硬件有任何深入了解。

NeuronLink v2——Inf2實例是AmazonEC2類型中首個將NeuronLink V2 用于推理優(yōu)化的實例，NeuronLink v2 為Inferentia2芯片間的提供超高速連接，加強分布式推理性能。NeuronLink v2使用all-reduce等聚合通信（CC）運算符，將高性能推理管道擴展到所有的推理芯片上。

新Inf2實例現(xiàn)已可用

用戶可在亞馬遜云科技美東（俄亥俄州）和美東（北弗吉尼亞州）地區(qū)啟動Inf2實例，以按需、預留和競價實例或Savings Plan方式調(diào)用。用戶僅需為其實際使用的服務付費。如需了解更多相關(guān)信息，請訪問Amazon EC2定價網(wǎng)站。

Inf2實例可使用亞馬遜云科技深度學習鏡像進行部署，并可通過Amazon SageMaker、Amazon Elastic Kubernetes Service（Amazon EKS）、Amazon Elastic Container Service（Amazon ECS）和Amazon ParallelCluster等托管服務調(diào)用。

如需了解更多信息，請訪問Amazon EC2 Inf2實例頁面，并將相關(guān)反饋發(fā)送給Amazon re:Post for EC2；或垂詢您的AmazonSupport聯(lián)系人。

審核編輯：湯梓紅

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

半導體

半導體

+關(guān)注

關(guān)注
334

文章
27435

瀏覽量
219340
AI

AI

+關(guān)注

關(guān)注
87

文章
30998

瀏覽量
269303
亞馬遜

亞馬遜

+關(guān)注

關(guān)注
8

文章
2668

瀏覽量
83412
深度學習

深度學習

+關(guān)注

關(guān)注
73

文章
5504

瀏覽量
121227
生成式AI

生成式AI

+關(guān)注

關(guān)注
0

文章
505

瀏覽量
482

NeuroBlade攜手亞馬遜EC2 F2實例，加速數(shù)據(jù)分析

數(shù)據(jù)分析加速領(lǐng)域的領(lǐng)航者NeuroBlade，近日宣布與亞馬遜云科技(AWS)最新推出的Amazon Elastic Compute Cloud (Amazon EC2) F2

發(fā)表于 12-31 11:37 ?171次閱讀

亞馬遜云科技發(fā)布Amazon Trainium2實例

的發(fā)布，標志著亞馬遜云科技在人工智能訓練和部署領(lǐng)域邁出了重要一步。為了滿足用戶對高性能和高性價比的雙重需求，亞馬遜云科技還推出了Amazon EC2 Trn2 UltraServer

發(fā)表于 12-27 14:57 ?218次閱讀

亞馬遜云科技發(fā)布Amazon Bedrock新功能

近日，亞馬遜云科技宣布了一項重要更新——為其完全托管的Amazon Bedrock服務增添了多項創(chuàng)新功能。Amazon Bedrock旨在通過高性能基礎(chǔ)模型，助力用戶輕松構(gòu)建并擴展

發(fā)表于 12-25 15:52 ?121次閱讀

Amazon Bedrock全新升級，引領(lǐng)生成式AI應用新紀元

近日，亞馬遜云科技宣布了對Amazon Bedrock的重大升級，推出了三項創(chuàng)新功能，進一步鞏固了其在生成式人工智能領(lǐng)域的領(lǐng)先地位。 Amazon Bedrock作為一項完全托管的服務

發(fā)表于 12-24 11:43 ?324次閱讀

Amazon Bedrock全新升級，新增業(yè)界領(lǐng)先的AI防護、新智能體功能和模型定制能力

Amazon Bedrock新增自動化推理檢查、多智能體協(xié)作和模型蒸餾三項新功能，基于堅實的企業(yè)級功能基礎(chǔ)構(gòu)建，助力客戶更快地從概念驗證過渡到生產(chǎn)級的生成

發(fā)表于 12-12 15:56 ?142次閱讀

Amazon Bedrock推出多個新模型和全新強大的推理和數(shù)據(jù)處理功能

:Invent全球大會上，宣布推出Amazon Bedrock的多項創(chuàng)新功能。Amazon Bedrock是亞馬遜云科技一項完全托管的服務，旨在利用高性能基礎(chǔ)模型構(gòu)建和擴展生成

發(fā)表于 12-07 19:31 ?621次閱讀

<b class='flag-5'>Amazon</b> Bedrock推出多個新模型和全新強大的<b class='flag-5'>推理</b>和數(shù)據(jù)處理功能

亞馬遜云科技宣布Amazon Trainium2實例正式可用

的訓練和推理北京2024年12月5日?/美通社/ -- 亞馬遜云科技在2024 re:Invent全球大會上，宣布基于Amazon Trainium2的Amazon Elastic

發(fā)表于 12-06 09:15 ?173次閱讀

亞馬遜云科技宣布<b class='flag-5'>Amazon</b> Trainium<b class='flag-5'>2</b><b class='flag-5'>實例</b>正式<b class='flag-5'>可用</b>

亞馬遜云科技宣布Amazon EC2 P5e實例正式可用由英偉達H200 GPU提供支持

1.7倍，GPU內(nèi)存寬帶提升1.5倍。Amazon EC2 P5e非常適用于復雜的大型語言模型(LLM)和多模態(tài)基礎(chǔ)模型(FM)的訓練、微調(diào)和推理，用于支持最苛刻和計算密集型的生成

發(fā)表于 09-19 16:16 ?493次閱讀

AMD助力HyperAccel開發(fā)全新AI推理服務器

提高成本效率。HyperAccel 針對新興的生成式 AI 應用提供超級加速的芯片 IP/解決方案。HyperAccel 已經(jīng)打造出一個快速、高效且

發(fā)表于 09-18 09:37 ?374次閱讀

Mistral Large 2現(xiàn)已在Amazon Bedrock中正式可用

北京2024年7月25日 /美通社/ -- 亞馬遜云科技宣布，Mistral AI的Mistral Large 2（24.07）基礎(chǔ)模型（FM）現(xiàn)已在Amazon Bedrock中正式可用

發(fā)表于 07-26 08:07 ?344次閱讀

亞馬遜云科技宣布基于自研Amazon Graviton4的Amazon EC2 R8g實例正式可用

)?R8g實例現(xiàn)已正式可用。Amazon EC2 R8g實例與基于Amazon Graviton

發(fā)表于 07-15 16:09 ?389次閱讀

基于瑞薩RZ/V2H AI微處理器的解決方案：高性能視覺AI系統(tǒng)

復雜的實時物體識別及推理，同時功耗可與傳統(tǒng)的嵌入式MPU相媲美，無需冷卻風扇。這里介紹基于RZ/V2H的解決方案：高性能視覺AI系統(tǒng)。

發(fā)表于 07-02 18:36 ?528次閱讀

亞馬遜云科技宣布生成式AI助手Amazon Q正式可用

亞馬遜云科技近日宣布全新服務Amazon Q正式開放使用，該服務作為一款前沿的生成式人工智能（AI）助手，專為加速軟件開發(fā)并最大化公司內(nèi)部數(shù)據(jù)價值而設計。

發(fā)表于 05-09 10:58 ?534次閱讀

Mistral Large模型現(xiàn)已在Amazon Bedrock上正式可用

的 Mistral 7B 和 Mixtral 8x7B模型。今天，Mistral AI最新且最前沿的大語言模型（LLM）Mistral Large又在Amazon Bedrock上正式可用，這些將為客戶構(gòu)建

發(fā)表于 04-08 16:26 ?564次閱讀

企業(yè)組網(wǎng)如何兼顧低成本與高性能？

在數(shù)字化浪潮席卷全球的今天，企業(yè)的網(wǎng)絡需求變得愈加復雜和多樣化。面對激烈的市場競爭，企業(yè)不得不尋求一種既能降低成本又能保證高性能的網(wǎng)絡解決方案。傳統(tǒng)組網(wǎng)方式雖然穩(wěn)定可靠，但昂貴的硬件投入和升級成本讓

發(fā)表于 02-26 14:59 ?402次閱讀

搜索歷史

Amazon EC2 Inf2實例正式可用助力低成本、高性能的生成式AI推理

評論

NeuroBlade攜手亞馬遜EC2 F2實例，加速數(shù)據(jù)分析

亞馬遜云科技發(fā)布Amazon Trainium2實例

亞馬遜云科技發(fā)布Amazon Bedrock新功能

Amazon Bedrock全新升級，引領(lǐng)生成式AI應用新紀元

Amazon Bedrock全新升級，新增業(yè)界領(lǐng)先的AI防護、新智能體功能和模型定制能力

Amazon Bedrock推出多個新模型和全新強大的推理和數(shù)據(jù)處理功能

亞馬遜云科技宣布Amazon Trainium2實例正式可用

亞馬遜云科技宣布Amazon EC2 P5e實例正式可用由英偉達H200 GPU提供支持

AMD助力HyperAccel開發(fā)全新AI推理服務器

Mistral Large 2現(xiàn)已在Amazon Bedrock中正式可用

亞馬遜云科技宣布基于自研Amazon Graviton4的Amazon EC2 R8g實例正式可用

基于瑞薩RZ/V2H AI微處理器的解決方案：高性能視覺AI系統(tǒng)

亞馬遜云科技宣布生成式AI助手Amazon Q正式可用

Mistral Large模型現(xiàn)已在Amazon Bedrock上正式可用

企業(yè)組網(wǎng)如何兼顧低成本與高性能？

搜索歷史

Amazon EC2 Inf2實例正式可用 助力低成本、高性能的生成式AI推理

評論

Amazon EC2 Inf2實例正式可用助力低成本、高性能的生成式AI推理