欧美日韩久久免费精品,91精品国产综合久久精品导航,国产高清在线观看av不卡

自ChatGPT問世以來，大模型遍地開花，承載大模型應(yīng)用的高性能推理框架也不斷推出，大有百家爭鳴之勢。在這種情況下，澎峰科技作為全球領(lǐng)先的智能計算服務(wù)提供商，在2023年11月25日發(fā)布了針對大語言模型的高性能推理框架，并受到廣泛關(guān)注。在歷經(jīng)數(shù)月的迭代開發(fā)后，澎峰科技重磅發(fā)布升級版本，推出全新的高性能大模型推理引擎：PerfXLM。

PerfXLM采用了云端一體架構(gòu)，支持云端推理和本地推理兩種模式。在硬件支持上，PerfXLM適配了包含多種國產(chǎn)處理器在內(nèi)的不同硬件，并針對硬件體系結(jié)構(gòu)特征進行了深入性能優(yōu)化，大幅提升了大模型推理性能。

一、PerfXLM整體架構(gòu)

圖1.PerfXLM整體架構(gòu)

如圖1所示，PerfXLM整體架構(gòu)分為三層：

1.模型轉(zhuǎn)換層。將Torch或者Huggingface格式的大模型轉(zhuǎn)化為統(tǒng)一的內(nèi)部模型結(jié)構(gòu)，并最終統(tǒng)一表達為ONNX圖。

2.推理引擎層。實現(xiàn)了ONNX圖解析、算子調(diào)度、統(tǒng)一內(nèi)存管理等功能，大幅提升硬件資源利用率；同時，也提供了針對云端推理的專用Serving模塊，以獲得更高的硬件利用率和QPS響應(yīng)。

3.性能層。提供了針對大模型推理的高性能算子庫，并針對各種主流硬件進行了適配和優(yōu)化。

PerfXLM具有的三大特點：

1.云端一體，同時支持云側(cè)和端側(cè)大模型推理，能夠讓大模型適用于各種應(yīng)用場景之中。

2.支持多異構(gòu)平臺，支持了包括NVIDIA GPU、海光DCU、高通 Adreno GPU、Intel iGPU、某國產(chǎn)GPU在內(nèi)的多種硬件設(shè)備

3.高性能定制優(yōu)化算子，實現(xiàn)了結(jié)合體系結(jié)構(gòu)特征和大模型推理應(yīng)用特征的定制優(yōu)化。

二、大模型推理中的MxN問題

PerfXLM向上對接各種模型網(wǎng)絡(luò)，向下適配各種硬件架構(gòu)。這就存在著一個組合問題：假設(shè)需要支持M個模型和N種硬件，那么一共有MxN種組合方式。PerfXLM需要實現(xiàn)對主流模型的支持，目前主流模型大概有幾十種，國內(nèi)甚至一度“千模大戰(zhàn)”。同時，PerfXLM也需要實現(xiàn)對主流硬件的支持，包括NVIDIA GPU、AMD GPU、海光DCU、沐曦GPU等通用GPU架構(gòu)；X86、ARM、RISC-V等通用CPU架構(gòu)；高通Adreno GPU、ARM MALI GPU等移動GPU架構(gòu)；華為昇騰、寒武紀MLU、燧原等專用處理器架構(gòu)等。考慮到模型和硬件的迅猛發(fā)展，這個組合數(shù)大概有上千種，這就對大模型推理框架提出了很高的兼容性要求。

面對這樣的一個復(fù)雜問題，PerfXLM提出了一套解決方案：通過統(tǒng)一的模型表達，實現(xiàn)了對不同大模型的快速支持；通過統(tǒng)一算子API的定義，實現(xiàn)了對大模型圖的快速算子構(gòu)建；通過融合體系結(jié)構(gòu)特征和應(yīng)用特征的算子庫的構(gòu)建，實現(xiàn)了對不同硬件的快速適配。

同時，為了便于用戶使用，PerfXLM上層采用了與vllm一致的頂層API接口。用戶只需要在導(dǎo)入python模塊時，簡單地將vllm修改成perfxlm就能夠?qū)⒃械拇a運行起來并且獲得更高的性能表現(xiàn)。具體的使用示例如下圖。

圖2. PerfXLM API接口

通過這樣的一套架構(gòu)體系，PerfXLM可以快速地支持新的模型和新的硬件。以近日Meta開源的LLaMA3為例，假設(shè)算子完備的情況下，只需幾個小時的時間，就能夠?qū)⒃撟钚履Ｐ瓦\行在各種主流硬件設(shè)備上。

三、PerfXLM性能

云側(cè)和端側(cè)的應(yīng)用場景不同：云上側(cè)重于多用戶服務(wù)，關(guān)注的是整體吞吐；端側(cè)側(cè)重于單用戶的使用體驗，關(guān)注的是在低算力硬件上的響應(yīng)速度和延遲。下面講描述PerfXLM在單Batch和多Batch下的性能。

1）PerXLM在NVIDIA GPU上的性能

圖3. PerfXLM與vllm在A40上FP16的llama2性能對比

圖4. PerfXLM與vllm在4090上FP16的llama2性能對比

圖5.PerfXLM與vllm在A40上FP16的llama3性能對比

圖6.PerfXLM與vllm在4090上FP16的llama3性能對比

2）PerfXLM在海光DCU上的性能

圖7 PerfXLM與vllm在DCU Z100SM上的llama2性能對比

圖8 PerfXLM與vllm在DCU Z100SM上的llama3性能對比

3）PerfXLM在國產(chǎn)某GPU上的性能

圖9 PerfXLM在某國產(chǎn)GPU上的性能

4）PerfXLM在高通Adreno GPU上的性能

圖10 PerfXLM在高通Adreno的性能（單batch）

5）PerfXLM在Intel iGPU上的性能

圖11 PerfXLM在Intel iGPU上的性能（單batch）

未來，PerfXLM將繼續(xù)支持"更多的硬件 x更多的模型"。

阅读全文

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

澎峰科技

澎峰科技

+關(guān)注

關(guān)注
0

文章
67

瀏覽量
3317
大模型

大模型

+關(guān)注

關(guān)注
2

文章
2873

瀏覽量
3606

原文標題：爆款·大模型推理引擎PerfXLM發(fā)布

文章出處：【微信號：perfxlab，微信公眾號：perfxlab】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

2023RISC-V中國峰會，澎峰科技成果發(fā)布搶先看！

高性能計算領(lǐng)域設(shè)計的計算型服務(wù)器。衡山系列預(yù)裝澎峰自研的高性能計算行業(yè)解決方案HPC SDK：數(shù)學(xué)計算庫PerfMPL、異構(gòu)計算框架PerfXAPI、科學(xué)計算軟件PerfXPy等，使能

發(fā)表于 08-15 18:28

HarmonyOS：使用MindSpore Lite引擎進行模型推理

場景介紹 MindSpore Lite 是一款 AI 引擎，它提供了面向不同硬件設(shè)備 AI 模型推理的功能，目前已經(jīng)在圖像分類、目標識別、人臉識別、文字識別等應(yīng)用中廣泛使用。本文介紹

發(fā)表于 12-14 11:41

澎峰科技發(fā)布大模型推理引擎PerfXLLM

要的巨額開銷也引發(fā)了相關(guān)研究者的關(guān)注。如何高效地進行推理，并盡可能地減少成本，從而促進大模型應(yīng)用的落地成為了目前的關(guān)鍵問題。于是，澎峰科技研發(fā)了一款大

發(fā)表于 11-25 15:35 ?1427次閱讀

<b class='flag-5'>澎</b><b class='flag-5'>峰</b>科技發(fā)布大<b class='flag-5'>模型</b><b class='flag-5'>推理</b><b class='flag-5'>引擎</b>PerfXLLM

澎峰科技與并行科技共拓AI大模型技術(shù)創(chuàng)新應(yīng)用服務(wù)

4月17日，澎峰（北京）科技有限公司（以下簡稱“澎峰科技”）與北京并行科技股份有限公司（以下簡稱“并行科技”）簽署戰(zhàn)略合作協(xié)議。

發(fā)表于 04-23 09:54 ?590次閱讀

<b class='flag-5'>澎</b><b class='flag-5'>峰</b>科技與并行科技共拓AI大<b class='flag-5'>模型</b>技術(shù)創(chuàng)新應(yīng)用服務(wù)

澎峰科技CA100智能計算一體機核心優(yōu)勢解讀

峰科技PerfXLM Solution完整軟件生態(tài)，自研異構(gòu)計算軟件棧PerfXAPI，澎峰PerfMPL高性能數(shù)學(xué)庫、算子庫、領(lǐng)域加速包，

發(fā)表于 07-08 10:59 ?1123次閱讀

<b class='flag-5'>澎</b><b class='flag-5'>峰</b>科技CA100智能計算一體機核心優(yōu)勢解讀

澎峰科技受聘為“主權(quán)級大模型”創(chuàng)新聯(lián)合體學(xué)術(shù)委員會委員

日前，“主權(quán)級大模型“創(chuàng)新聯(lián)合體揭牌，澎峰科技CEO受聘為”主權(quán)級大模型“創(chuàng)新聯(lián)合體學(xué)術(shù)委員會委員。

發(fā)表于 09-02 17:37 ?1017次閱讀

澎峰科技受邀參加全球AI芯片峰會，探討大模型推理引擎PerfXLM面向RISC-V的移植和優(yōu)化

最高、影響力最強的產(chǎn)業(yè)峰會之一。本屆峰會由芯東西與智猩猩共同主辦，以「智算紀元共筑芯路」為主題。峰會采用“主會議+技術(shù)論壇+展覽展示”的全新形式。澎峰科技創(chuàng)始人&CEO張先軼博士受邀參加于9月7日下午舉辦的中國RISC-V計算創(chuàng)新論壇，屆時將與大家分享「面向R

發(fā)表于 09-05 16:22 ?469次閱讀

<b class='flag-5'>澎</b><b class='flag-5'>峰</b>科技受邀參加全球AI芯片峰會，探討大<b class='flag-5'>模型</b><b class='flag-5'>推理</b><b class='flag-5'>引擎</b><b class='flag-5'>PerfXLM</b>面向RISC-V的移植和優(yōu)化

澎峰科技“澎峰云”校園行活動回顧

在金秋十月的尾巴，澎峰科技的“澎峰云”校園行活動來到了湖南科技職業(yè)學(xué)院·軟件學(xué)院。澎峰科技為師生

發(fā)表于 10-24 11:22 ?639次閱讀

“澎峰云”校園行：湖南科技職業(yè)學(xué)院站，共啟校園創(chuàng)新之旅！

活動回顧在金秋十月的尾巴，澎峰科技的“澎峰云”校園行活動來到了湖南科技職業(yè)學(xué)院·軟件學(xué)院。澎峰

發(fā)表于 10-24 11:41 ?411次閱讀

第一屆“澎峰云?大模型AI校園應(yīng)用創(chuàng)新賽完美結(jié)束

在大模型人工智能的浪潮中，澎峰科技與中科曙光強強聯(lián)合，共同打造了一場大模型AI創(chuàng)新應(yīng)用盛宴——第一屆“澎

發(fā)表于 11-11 10:59 ?582次閱讀

澎峰科技PerfXCloud平臺獲海光DCU生態(tài)兼容性認證

PerfXCloud是由澎峰科技自主研發(fā)的大模型開發(fā)與服務(wù)云平臺，是主要面向教育、文旅、企業(yè)、政府等行業(yè)打造的一站式大模型微調(diào)推理應(yīng)用服務(wù)的

發(fā)表于 12-13 14:44 ?456次閱讀

澎峰科技攜手湖南第一師范，開啟大模型AI學(xué)習(xí)新模式

澎峰科技作為國內(nèi)領(lǐng)先的AI Infra企業(yè)，始終致力于推動AI技術(shù)的普及與教育。近日，澎峰科技與湖南第一師范的師生們一起探索推進了一場知識的盛宴—— 大

發(fā)表于 12-17 18:16 ?553次閱讀

澎峰科技計算軟件棧與沐曦GPU完成適配和互認證

?近期，澎峰科技與沐曦完成了對PerfXLM（推理引擎）、PerfXCloud（大模型服務(wù)平臺）

發(fā)表于 01-21 09:51 ?389次閱讀

澎峰科技與沐曦完成聯(lián)合測試，實現(xiàn)全面兼容

近日，澎峰科技與沐曦科技宣布，雙方已完成對PerfXLM推理引擎、PerfXCloud大模型服務(wù)

發(fā)表于 01-21 15:20 ?463次閱讀

澎峰科技DeepSeek智算一體機助力中小企業(yè)AI轉(zhuǎn)型

澎峰科技推出的智算先鋒 Deep Fusion DF系列大模型一體機是專為中小企業(yè)、事業(yè)單位以及對數(shù)據(jù)安全有極高要求的部門(財務(wù)、人力、研發(fā)、銷售等)設(shè)計的高性能大

發(fā)表于 02-28 11:07 ?489次閱讀

搜索歷史

澎峰科技高性能大模型推理引擎PerfXLM解析

評論

2023RISC-V中國峰會，澎峰科技成果發(fā)布搶先看！

HarmonyOS：使用MindSpore Lite引擎進行模型推理

澎峰科技發(fā)布大模型推理引擎PerfXLLM

澎峰科技與并行科技共拓AI大模型技術(shù)創(chuàng)新應(yīng)用服務(wù)

澎峰科技CA100智能計算一體機核心優(yōu)勢解讀

澎峰科技受聘為“主權(quán)級大模型”創(chuàng)新聯(lián)合體學(xué)術(shù)委員會委員

澎峰科技受邀參加全球AI芯片峰會，探討大模型推理引擎PerfXLM面向RISC-V的移植和優(yōu)化

澎峰科技“澎峰云”校園行活動回顧

“澎峰云”校園行：湖南科技職業(yè)學(xué)院站，共啟校園創(chuàng)新之旅！

第一屆“澎峰云?大模型AI校園應(yīng)用創(chuàng)新賽完美結(jié)束

澎峰科技PerfXCloud平臺獲海光DCU生態(tài)兼容性認證

澎峰科技攜手湖南第一師范，開啟大模型AI學(xué)習(xí)新模式

澎峰科技計算軟件棧與沐曦GPU完成適配和互認證

澎峰科技與沐曦完成聯(lián)合測試，實現(xiàn)全面兼容

澎峰科技DeepSeek智算一體機助力中小企業(yè)AI轉(zhuǎn)型

電子發(fā)燒友