亚洲综合鲁鲁久久五月天,亚洲精品乱码久久久久久自慰,国产欧美日韩成人

人工智能 (AI) 技術(shù)的深入應(yīng)用為數(shù)字化轉(zhuǎn)型注入了充沛的動能，引領(lǐng)著新一輪技術(shù)與產(chǎn)業(yè)的創(chuàng)新浪潮。隨著 AI 技術(shù)的不斷發(fā)展以及行業(yè)應(yīng)用的逐步成熟，AI 市場正在出現(xiàn)快速的增長。IDC 預(yù)計(jì)，中國人工智能市場規(guī)模在 2023 年將超過 147 億美元，到 2026年將超過 264 億美元¹。

在端到端的 AI 整體應(yīng)用流程中，AI 推理是其中的關(guān)鍵環(huán)節(jié)。在 AI 推理的算力設(shè)備選擇方面，CPU 服務(wù)器具備更強(qiáng)的靈活性、敏捷性，能夠支持大數(shù)據(jù)、云計(jì)算、虛擬化等多種業(yè)務(wù)的彈性擴(kuò)展，方便部署和管理，滿足企業(yè)不同業(yè)務(wù)場景的動態(tài)資源需求。此外，通過面向 AI 工作負(fù)載的技術(shù)特性升級以及性能優(yōu)化，CPU 已經(jīng)能夠廣泛滿足用戶不同 AI 應(yīng)用對于算力的要求，在大量場景中的推理性能可比肩GPU，助力客戶節(jié)省成本，同時(shí)提升 AI 基礎(chǔ)設(shè)施的可靠性與敏捷性。

為了進(jìn)一步提升旗下產(chǎn)品“神農(nóng) AI 中臺” 的性能，東華軟件股份公司（以下簡稱：東華軟件）和英特爾攜手，由東華軟件旗下的東華發(fā)思特 AI 團(tuán)隊(duì)與英特爾技術(shù)團(tuán)隊(duì)就神農(nóng) AI 中臺展開合作，將基于英特爾至強(qiáng) 可擴(kuò)展處理器的服務(wù)器作為推理服務(wù)器，并通過OpenVINO 工具套件將神農(nóng) AI 引擎框架訓(xùn)練的模型進(jìn)行量化，利用英特爾DL Boost 的矢量神經(jīng)網(wǎng)絡(luò)指令 (VNNI) 提高人工智能推理能力。在既有合作成果的基礎(chǔ)上，雙方將推理服務(wù)器中的處理器升級為第四代英特爾至強(qiáng) 可擴(kuò)展處理器，將OpenVINO 工具套件升級為 2023 版，將推理速度提升了數(shù)倍以上。

聯(lián)合創(chuàng)新，神農(nóng)AI中臺在算力、
成本、敏捷性方面實(shí)現(xiàn)更好平衡

東華發(fā)思特研發(fā)的神農(nóng) AI 中臺具備人工智能中臺和模型 SaaS 服務(wù)能力，其推理引擎提供了豐富的版本，包含 OpenVINO版，為客戶提供豐富、高效的模型推理服務(wù)，在智慧城市、數(shù)字鄉(xiāng)村等場景有著廣泛的應(yīng)用。為了滿足業(yè)務(wù)發(fā)展和用戶增加的需要，在算力、成本、敏捷性等方面實(shí)現(xiàn)更卓越的平衡，東華發(fā)思特與英特爾進(jìn)行了聯(lián)合創(chuàng)新。在進(jìn)行測試之后，東華發(fā)思特發(fā)現(xiàn)，將神農(nóng) AI 中臺推理服務(wù)器的CPU 從英特爾至強(qiáng) 黃金 6348 處理器升級為英特爾至強(qiáng)鉑金 8480+ 處理器之后，能夠最大程度上提升性能表現(xiàn)，同時(shí)保證較高的經(jīng)濟(jì)效益。

該方案除了搭載高性能、面向人工智能應(yīng)用進(jìn)行優(yōu)化的第四代英特爾至強(qiáng) 可擴(kuò)展處理器，還通過 OpenVINO 工具套件進(jìn)行了性能優(yōu)化，并支持技術(shù)的持續(xù)創(chuàng)新。第四代英特爾至強(qiáng) 可擴(kuò)展處理器與 OpenVINO 工具套件的結(jié)合可以進(jìn)一步提升 AI 推理性能。OpenVINO 工具套件支持從邊緣到云的深度學(xué)習(xí)推理，可在包括英特爾 CPU、iGPU 和FPGA 在內(nèi)的英特爾硬件平臺（包括加速器）上部署并加速神經(jīng)網(wǎng)絡(luò)模型，能夠在保持精度的同時(shí)提高推理速度。OpenVINO工具套件支持開發(fā)人員使用行業(yè)標(biāo)準(zhǔn)人工智能框架、標(biāo)準(zhǔn)或自定義層，將深度學(xué)習(xí)推理輕松集成到應(yīng)用中。

東華發(fā)思特與英特爾合作，在以下方面進(jìn)行了重點(diǎn)優(yōu)化：

針對復(fù)雜網(wǎng)絡(luò)的模型結(jié)構(gòu)壓縮技術(shù)：為壓縮網(wǎng)絡(luò)結(jié)構(gòu)，節(jié)省數(shù)據(jù)在內(nèi)存中的讀寫耗時(shí)，在讀取訓(xùn)練模型后，將對其網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行深度分析，基于預(yù)設(shè)策略，將一些常見的線性算子進(jìn)行融合處理。針對多任務(wù)場景的跨平臺異構(gòu)加速技術(shù)：通過異步執(zhí)行策略，將推理任務(wù)平均分配到不同的 CPU 內(nèi)核資源上，減少多線程間的任務(wù)同步，提供網(wǎng)絡(luò)吞吐能力。同時(shí)能夠根據(jù)設(shè)備負(fù)載情況，自動將推理任務(wù)以模型子圖為單位，在 CPU 和 GPU上進(jìn)行動態(tài)部署，全面激活英特爾平臺的 iGPU 資源，提升設(shè)備使用率，降低項(xiàng)目整體成本。在圖像識別等場景的深度學(xué)習(xí)中發(fā)揮優(yōu)勢：基于 MKL/MKLDNN對不同深度學(xué)習(xí)模型進(jìn)行特定優(yōu)化，利用英特爾至強(qiáng)可擴(kuò)展處理器內(nèi)置的英特爾深度學(xué)習(xí)加速技術(shù)對 INT8 提供更優(yōu)的支持。

英特爾 AMX加持
推理性能大幅提升

在本次優(yōu)化中，東華發(fā)思特重點(diǎn)利用了第四代英特爾至強(qiáng) 可擴(kuò)展處理器內(nèi)置的英特爾AMX (Advanced Matrix Extensions)高級矩陣擴(kuò)展加速引擎。英特爾AMX 采用了全新的指令集與電路設(shè)計(jì)，包含了一系列用于矩陣運(yùn)算的指令集 TMUL，以及新的矩陣寄存器文件 TILEs。英特爾 AMX 還支持 INT8 和 BF16 數(shù)據(jù)類型。其中，BF16 能夠提供與 FP32 相似的精度，但是在 AI工作負(fù)載中的訓(xùn)練和推理方面能夠帶來大幅的性能提升。

為了驗(yàn)證新方案對比舊方案的性能提升，東華發(fā)思特進(jìn)行了一系列測試，其選擇的模型為圖像分類模型 ResNet50_vd，ResNet50_vd是一種深度卷積神經(jīng)網(wǎng)絡(luò)模型，它是在 ResNet50 的基礎(chǔ)上進(jìn)行改進(jìn)的。ResNet50 是一種非常流行的卷積神經(jīng)網(wǎng)絡(luò)模型，它在ImageNet 數(shù)據(jù)集上取得了很好的表現(xiàn)，但在訓(xùn)練過程中容易出現(xiàn)梯度消失或梯度爆炸等問題。ResNet50_vd 通過引入一些改進(jìn)，使得網(wǎng)絡(luò)的訓(xùn)練更加穩(wěn)定，同時(shí)在性能上也有一定提升。

測試的軟硬件配置如表 1 所示，東華發(fā)思特分別測試了在其他配置不變的前提下，處理器升級所帶來的性能提升；以及在同樣硬件配置的前提下，不同模型精度所帶來的性能差異。

表 1. 測試軟硬件配置

	原有方案	新方案
處理器	2*英特爾至強(qiáng)金牌6348 處理器@ 2.60GHz	2*英特爾至強(qiáng)鉑金8480+ 處理器@ 2.0GHz
核數(shù)	28 *2	56 *2
內(nèi)存	24*32 GB DDR4 2933 MHz	16*16 GB DDR5 4800 MHz
操作系統(tǒng)	Ubuntu 20.04.5 LTS	CentOS Linux release 8.5.2111
神農(nóng)AI中臺	ShenNong-AI.2022 (OpenVINO)	ShenNong-AI.2022 (OpenVINO) ShenNong-AI.2023 (OpenVINO)

在第一輪測試中，東華發(fā)思特對比了神農(nóng)AI 中臺推理引擎（OpenVINO2022 版）分別在第三代/第四代英特爾至強(qiáng) 可擴(kuò)展處理器上的運(yùn)行性能差異。對比第三代英特爾至強(qiáng) 可擴(kuò)展處理器方案，第四代英特爾至強(qiáng) 可擴(kuò)展處理器將推理能力提升了約4.5 倍 (FPS)²，同時(shí)保持了推理準(zhǔn)確度。

在第二輪測試中，東華發(fā)思特對比了在 INT8 與 BF16 精度下的性能差異。測試數(shù)據(jù)如圖 3 所示，INT8 處理模型在體積減少的同時(shí)，在推理性能上實(shí)現(xiàn)了 1.5 倍 (FPS) 的性能提升³。

第四代英特爾 至強(qiáng) 可擴(kuò)展處理器
為客戶提供更低成本高收益的AI解決方案

眾所周知，硬件算力是AI推理引擎運(yùn)行的關(guān)鍵因素之一，因此選擇合適的硬件設(shè)備對于推理引擎的性能和效率至關(guān)重要。雖然 GPU 服務(wù)器在深度學(xué)習(xí)模型推理方面具有較高的性能和效率，但是仍然存在一些不足之處。

首先，采用 GPU 服務(wù)器進(jìn)行深度學(xué)習(xí)模型推理，需要專門的 GPU 硬件設(shè)備，這將帶來較高的硬件采購和配套設(shè)施建設(shè)成本。此外，GPU 服務(wù)器的應(yīng)用范圍受限，不夠靈活，難以適應(yīng)不同場景的需求。其次，GPU 服務(wù)器上進(jìn)行深度學(xué)習(xí)模型推理需要復(fù)雜的部署和調(diào)優(yōu)，門檻相對較高，難以滿足新增應(yīng)用快速上線的需求。相比之下，CPU 服務(wù)器具有更強(qiáng)的靈活性、敏捷性和可擴(kuò)展性，適用于大數(shù)據(jù)、云計(jì)算、虛擬化等多種業(yè)務(wù)場景，方便部署和管理，能夠滿足企業(yè)不同業(yè)務(wù)場景的動態(tài)資源需求。另外，隨著技術(shù)的不斷發(fā)展，CPU 在面向 AI 工作負(fù)載的技術(shù)特性升級和性能優(yōu)化方面也有了很大的進(jìn)步。通過使用新的處理器架構(gòu)、加速器、向量計(jì)算單元等技術(shù)，CPU 已經(jīng)能夠廣泛滿足客戶不同 AI 應(yīng)用對于算力的要求。同時(shí)，CPU 的高可靠性和穩(wěn)定性也能夠保證算法的運(yùn)行穩(wěn)定性和數(shù)據(jù)的安全性。

基于第四代英特爾至強(qiáng) 可擴(kuò)展處理器以及最新版的 OpenVINO 工具套件，英特爾提供的AI解決方案，使東華發(fā)思特神農(nóng) AI 中臺的 AI 推理性能得到提升的同時(shí)，使硬件采購成本以及空間、功耗和軟硬件調(diào)優(yōu)等成本則得到降低，為客戶帶來了以下價(jià)值：

[ 更好的性能表現(xiàn) ]

推理引擎通過使用最新的技術(shù)和硬件平臺，提高了推理性能和效率，從而可以更快地執(zhí)行深度學(xué)習(xí)模型的推理計(jì)算，在部分應(yīng)用場景中的性能表現(xiàn)比肩 GPU，為深度學(xué)習(xí)應(yīng)用提供更高效、更穩(wěn)定的支持。

[ 更低的成本和更高的效益 ]

推理引擎使用高效的 AI 工作負(fù)載加速方式，可以在保證性能的同時(shí)，降低硬件和軟件的成本，提高推理的效益。對比基于獨(dú)立 GPU 的方案，該方案的成本優(yōu)勢更加明顯。

[ 更好的兼容性 ]

推理引擎可以在不同的硬件平臺和操作系統(tǒng)內(nèi)核上運(yùn)行，支持多種深度學(xué)習(xí)框架和模型，具有很好的兼容性和靈活性，可以滿足不同客戶的需求。

東華發(fā)思特與英特爾在現(xiàn)有合作基礎(chǔ)上，繼續(xù)探索第四代英特爾至強(qiáng)可擴(kuò)展處理器在 AI 領(lǐng)域的推理性能潛力，證明了第四代英特爾至強(qiáng) 可擴(kuò)展處理器在架構(gòu)和高級硬件特性方面的提升，有助于加速 AI 負(fù)載。切換到基于第四代英特爾至強(qiáng) 可擴(kuò)展處理器的基礎(chǔ)設(shè)施平臺后，東華發(fā)思特有望提高神農(nóng) AI 中臺的效益和性能，為客戶帶來更高效的 AI 服務(wù)。

面向新一輪 AI 領(lǐng)域的大變革，東華發(fā)思特與英特爾未來將深度整合AI 領(lǐng)域的技術(shù)合作，包括基礎(chǔ)設(shè)施和模型算法的優(yōu)化等，為客戶提供更先進(jìn)的算法和模型，以及更靈活和更可擴(kuò)展的計(jì)算架構(gòu)和平臺，助力客戶實(shí)現(xiàn)業(yè)務(wù) AI 的升級與轉(zhuǎn)型。

資料援引：1.https://www.idc.com/getdoc.jsp?containerId=prCHC50539823 ，截至 2023 年 6 月。

2.數(shù)據(jù)援引自東華發(fā)思特與英特爾截止 2023 年 5 月的內(nèi)部測試結(jié)果。測試配置：原有方案 — 雙路英特爾至強(qiáng)金牌 6348 處理器 @ 2.60GHz，28 核，768 GB 總內(nèi)存 (24*32 GB DDR4 2933 MHz)，Ubuntu 20.04.5 LTS，ShenNong-AI.2022 (OpenVINO)；新方案 — 雙路英特爾至強(qiáng)鉑金 8480+ 處理器 @ 2.0GHz，56 核，256 GB 總內(nèi)存 (16*16 GB DDR5 4800 MHz)，CentOS Linux release 8.5.2111，ShenNong-AI.2022 (OpenVINO) 和 ShenNong-AI.2023 (OpenVINO)。英特爾并不控制或?qū)徲?jì)第三方數(shù)據(jù)。請您審查該內(nèi)容，咨詢其他來源，并確認(rèn)提及數(shù)據(jù)是否準(zhǔn)確。 3.數(shù)據(jù)援引自東華發(fā)思特與英特爾截止 2023 年 5 月的內(nèi)部測試結(jié)果。測試配置：雙路英特爾至強(qiáng)鉑金 8480+ 處理器 @ 2.0GHz，56 核，256 GB 總內(nèi)存 (16*16 GB DDR5 4800 MHz)，CentOS Linux release 8.5.2111，ShenNong-AI.2022 (OpenVINO) 和 ShenNong-AI.2023 (OpenVINO)。英特爾并不控制或?qū)徲?jì)第三方數(shù)據(jù)。請您審查該內(nèi)容，咨詢其他來源，并確認(rèn)提及數(shù)據(jù)是否準(zhǔn)確。

想看更多“芯”資訊

用你的贊和在看告訴我們～

英

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報(bào)投訴

英特爾

英特爾

+關(guān)注

關(guān)注
61

文章
9999

瀏覽量
172045
cpu

cpu

+關(guān)注

關(guān)注
68

文章
10891

瀏覽量
212441

原文標(biāo)題：第四代英特爾? 至強(qiáng)? 可擴(kuò)展處理器助東華發(fā)思特“神農(nóng) AI 中臺”推理性能提升4.5倍

文章出處：【微信號：英特爾中國，微信公眾號：英特爾中國】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

英特爾帶您解鎖云上智算新引擎

在近日舉辦的2024火山引擎FORCE原動力大會上，英特爾與火山引擎聯(lián)合發(fā)布基于英特爾 至強(qiáng) 6 性能核處理器的

發(fā)表于 12-23 14:05 ?268次閱讀

面向科學(xué)計(jì)算，第五代英特爾至強(qiáng)可擴(kuò)展處理器優(yōu)勢何在

與上一代產(chǎn)品相比：第五代英特爾?至強(qiáng)?處理器的平均科學(xué)計(jì)算性能

發(fā)表于 12-07 10:56 ?618次閱讀

英特爾發(fā)布至強(qiáng)6性能核處理器

近日，英特爾正式推出了其全新的英特爾? 至強(qiáng)? 6性能核處理器（代號Granite Rapids），旨在為

發(fā)表于 09-30 16:22 ?459次閱讀

英特爾?至強(qiáng)?可擴(kuò)展處理器助力智慧醫(yī)療的數(shù)字化轉(zhuǎn)型

在現(xiàn)代醫(yī)療行業(yè)，人工智能（AI）、物聯(lián)網(wǎng)（IoT）和5G網(wǎng)絡(luò)等前沿技術(shù)正在重新定義醫(yī)療服務(wù)的提供方式。英特爾?至強(qiáng)?可擴(kuò)展

發(fā)表于 09-29 11:13 ?6120次閱讀

<b class='flag-5'>英特爾</b>?<b class='flag-5'>至強(qiáng)</b>?<b class='flag-5'>可</b><b class='flag-5'>擴(kuò)展</b><b class='flag-5'>處理器</b>助力智慧醫(yī)療的數(shù)字化轉(zhuǎn)型

英特爾發(fā)布至強(qiáng)6處理器產(chǎn)品

以“綠色向新，釋放新質(zhì)生產(chǎn)力”為主題的英特爾至強(qiáng)6能效核處理器新品發(fā)布會在北京舉行。會上，英特爾重磅推出首款配備能效核的英特爾

發(fā)表于 09-23 15:48 ?386次閱讀

開箱即用，AISBench測試展示英特爾至強(qiáng)處理器的卓越推理性能

。中國電子技術(shù)標(biāo)準(zhǔn)化研究院賽西實(shí)驗(yàn)室依據(jù)國家標(biāo)準(zhǔn)《人工智能服務(wù)器系統(tǒng)性能測試規(guī)范》（征求意見稿）相關(guān)要求，使用AISBench?2.0測試工具，完成了第五代英特爾

發(fā)表于 09-06 15:33 ?381次閱讀

開箱即用，AISBench測試展示<b class='flag-5'>英特爾</b><b class='flag-5'>至強(qiáng)</b><b class='flag-5'>處理器</b>的卓越<b class='flag-5'>推理性能</b>

用友攜手英特爾發(fā)布《用友BIP+英特爾第四代至強(qiáng)私有化部署藍(lán)皮書》

近日，由用友網(wǎng)絡(luò)主辦的“成就數(shù)智企業(yè)”2024大型企業(yè)數(shù)智化峰會·西北峰會在陜西西安成功召開。在企業(yè)數(shù)智化底座與數(shù)據(jù)智能創(chuàng)新論壇上，用友攜手英特爾共同發(fā)布了《用友BIP+英特爾第四代至強(qiáng)

發(fā)表于 06-15 11:28 ?1120次閱讀

浪潮信息元腦?服務(wù)器率先支持英特爾?至強(qiáng)?6處理器

支持最新英特爾?至強(qiáng)?6處理器，具備更出色的性能和能效表現(xiàn)，相比第三代至強(qiáng)

發(fā)表于 06-07 15:36 ?416次閱讀

寧暢B5000 G5多節(jié)點(diǎn)服務(wù)器采用第五代英特爾至強(qiáng)可擴(kuò)展處理器

“基于第五代英特爾 至強(qiáng) 可擴(kuò)展處理器的寧暢B5000 G5多節(jié)點(diǎn)服務(wù)

發(fā)表于 05-27 11:46 ?862次閱讀

借助英特爾? QAT從而顯著提升網(wǎng)絡(luò)和存儲應(yīng)用的性能

全新第四代和第五代英特爾? 至強(qiáng)? 可擴(kuò)展處理器內(nèi)置

發(fā)表于 03-18 16:25 ?1098次閱讀

第五代英特爾至強(qiáng)處理器，AI特化的通用服務(wù)器CPU

計(jì)算性能的同時(shí)，也新增了AI相關(guān)的新指令集，諸如AXM、AVX等。第五代至強(qiáng)可擴(kuò)展

發(fā)表于 03-18 08:14 ?4475次閱讀

英特爾展示下一代至強(qiáng)處理器，助力vRAN性能顯著提升

-- 與ATT和愛立信亦宣布計(jì)劃與英特爾合作部署和擴(kuò)展Open RAN服務(wù)。最近，Telus和三星宣布計(jì)劃部署基于第四代英特爾?至強(qiáng)?

發(fā)表于 03-01 15:43 ?464次閱讀

英特爾至強(qiáng)處理器優(yōu)化升級，助力打造未來高能效數(shù)據(jù)中心

英特爾最新發(fā)布的第五代至強(qiáng)可擴(kuò)展處理器，擁有多達(dá)64個(gè)核心，

發(fā)表于 02-26 17:39 ?768次閱讀

高性能存儲實(shí)現(xiàn)新突破的英特爾至強(qiáng)處理器

基于第四代英特爾 至強(qiáng) 可擴(kuò)展處理器的 Curve 高性能

發(fā)表于 02-26 14:01 ?530次閱讀

使用基于Transformers的API在CPU上實(shí)現(xiàn)LLM高效推理

英特爾 Extension for Transformers是英特爾推出的一個(gè)創(chuàng)新工具包，可基于英特爾 架構(gòu)平臺，尤其是第四代

發(fā)表于 01-22 11:11 ?2771次閱讀