0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

CPU推理:AI算力配置新范式

阿丘科技 ? 2024-11-21 01:03 ? 次閱讀
613ef124-a761-11ef-8084-92fbcf53809c.png

在當(dāng)前的人工智能領(lǐng)域,尤其是涉及到深度學(xué)習(xí)的推理階段,行業(yè)普遍認(rèn)為GPU是唯一的選擇。然而,GPU的成本相對(duì)較高,且對(duì)于某些特定的應(yīng)用場(chǎng)景,其高昂的價(jià)格和較高的能耗成為了一大負(fù)擔(dān)。

相比之下,CPU作為一種性?xún)r(jià)比極高的推理硬件,逐漸進(jìn)入了人們的視野,尤其是在對(duì)結(jié)果準(zhǔn)確度有較高要求且需要考慮成本效益的行業(yè)中,如制造業(yè)、圖像處理與分析等。經(jīng)過(guò)數(shù)年的內(nèi)部研究,阿丘科技工業(yè)AI視覺(jué)算法平臺(tái)軟件AIDI已經(jīng)成功驗(yàn)證了CPU推理的可行性,為行業(yè)提供了新的解決方案。

具體應(yīng)用場(chǎng)景01

舊產(chǎn)線改造

許多制造企業(yè)的生產(chǎn)線啟動(dòng)時(shí)間較早,初期采用的傳統(tǒng)算法并不過(guò)多依賴(lài)于GPU資源。隨著時(shí)間的發(fā)展,這些產(chǎn)線的主板可能無(wú)法支持新增的GPU、NPU、TPU等加速卡。

在這種情況下,如果企業(yè)希望在其生產(chǎn)線上添加AI檢測(cè)功能,全面更換工控機(jī)會(huì)導(dǎo)致成本激增,并延長(zhǎng)上線周期。通過(guò)使用AIDI提供的CPU推理模式,企業(yè)可以迅速實(shí)現(xiàn)AI檢測(cè)功能的上線,同時(shí)避免了高昂的硬件升級(jí)費(fèi)用。

相關(guān)詞語(yǔ)解釋?zhuān)?/strong>

CPU(中央處理器,Central Processing Unit)

CPU是計(jì)算機(jī)的主要處理單元,負(fù)責(zé)執(zhí)行系統(tǒng)中的大部分基本指令集,包括算術(shù)邏輯運(yùn)算、控制單元的功能以及數(shù)據(jù)的移動(dòng)等。它通常設(shè)計(jì)為能夠高效地處理廣泛的任務(wù),從運(yùn)行操作系統(tǒng)到執(zhí)行應(yīng)用程序的各種任務(wù)。

GPU(圖形處理器,Graphics Processing Unit)

GPU最初是為加速計(jì)算機(jī)圖形渲染而設(shè)計(jì)的處理器,但現(xiàn)在其應(yīng)用范圍已經(jīng)遠(yuǎn)遠(yuǎn)超出了圖形處理領(lǐng)域。GPU擁有大量的核心,能夠并行處理大量數(shù)據(jù),這使得它們?cè)趫D像和視頻處理、深度學(xué)習(xí)、科學(xué)計(jì)算等領(lǐng)域非常有用。

NPU(神經(jīng)網(wǎng)絡(luò)處理器,Neural Network Processing Unit)

NPU是一種專(zhuān)門(mén)為處理機(jī)器學(xué)習(xí)算法而設(shè)計(jì)的微處理器,尤其是針對(duì)深度學(xué)習(xí)任務(wù)。NPU優(yōu)化了對(duì)向量和矩陣運(yùn)算的支持,這些運(yùn)算是神經(jīng)網(wǎng)絡(luò)訓(xùn)練和推理過(guò)程中的基礎(chǔ)。

TPU(張量處理單元,Tensor Processing Unit)

TPU是由谷歌開(kāi)發(fā)的一種定制ASIC(專(zhuān)用集成電路),專(zhuān)門(mén)用于加速機(jī)器學(xué)習(xí)工作負(fù)載,特別是針對(duì)使用TensorFlow框架的應(yīng)用程序。TPU能夠高效地執(zhí)行大規(guī)模的矩陣運(yùn)算,這對(duì)于訓(xùn)練和推斷階段的深度學(xué)習(xí)模型至關(guān)重要。

02

輕量型項(xiàng)目

對(duì)于一些新的項(xiàng)目,尤其是那些算力需求較小的場(chǎng)景(如圖像小于500萬(wàn)像素,僅需進(jìn)行圖像分類(lèi)或單圖推理,且可接受100毫秒的延遲),使用單個(gè)GPU卡往往無(wú)法達(dá)到滿負(fù)荷運(yùn)行的狀態(tài),從而造成資源浪費(fèi)。

這類(lèi)項(xiàng)目非常適合采用CPU進(jìn)行推理,訓(xùn)練階段則可以利用GPU工控機(jī)或云端資源。這種方法不僅能夠顯著降低硬件采購(gòu)成本,還能確保項(xiàng)目的順利推進(jìn)。

03

舊產(chǎn)線改造的具體情形

如下圖所示,通過(guò)傳統(tǒng)算法進(jìn)行項(xiàng)目的測(cè)量與檢測(cè),硬件配置主要為CPU+內(nèi)存+主板。

61635b2c-a761-11ef-8084-92fbcf53809c.png

圖:舊產(chǎn)線

目前,舊產(chǎn)線改造通常有以下兩種情形。

情形一:硬件配置基本不變,即CPU+內(nèi)存+主板,通過(guò)傳統(tǒng)算法做測(cè)量,而利用AI算法做外觀檢測(cè)。

616ab3fe-a761-11ef-8084-92fbcf53809c.png

圖:情形一

情形二:硬件配置基本不變,即CPU+內(nèi)存+主板,通過(guò)傳統(tǒng)算法做測(cè)量與外觀檢測(cè),而利用AI算法做缺陷復(fù)判。

616e662a-a761-11ef-8084-92fbcf53809c.png

圖:情形二AIDI-CPU推理的優(yōu)勢(shì)01

推理速度比肩GTX1060,500萬(wàn)圖像像素級(jí)推理僅需50ms

AIDI的CPU推理在速度方面表現(xiàn)出色,其底層采用DefectNet網(wǎng)絡(luò)+Aqinfer推理引擎的創(chuàng)新模式。

617a8f4a-a761-11ef-8084-92fbcf53809c.png

DefectNet網(wǎng)絡(luò)專(zhuān)門(mén)針對(duì)工業(yè)數(shù)據(jù)的特性而設(shè)計(jì),具備輕量且檢測(cè)能力強(qiáng)的特點(diǎn)。Aqinfer自研推理引擎則針對(duì)工業(yè)場(chǎng)景中圖像分辨率高、目標(biāo)小的特點(diǎn),在原本就較高的推理速度基礎(chǔ)上,進(jìn)一步優(yōu)化計(jì)算速度。

02

節(jié)省硬件成本,降低耗能風(fēng)險(xiǎn)

CPU在市場(chǎng)上供應(yīng)充足,價(jià)格相對(duì)更為親民,相較于一些高性能GPU,CPU的獲取成本更低。對(duì)于企業(yè)來(lái)說(shuō),尤其是預(yù)算有限的中小企業(yè),選擇CPU推理可以在不犧牲太多性能的前提下,大幅降低硬件采購(gòu)成本。

以一家小型服裝加工廠為例,在引入AI檢測(cè)系統(tǒng)時(shí),如果選擇GPU方案,高昂的硬件成本可能使其望而卻步;而采用CPU推理方案,僅需利用現(xiàn)有的工控機(jī)資源,就能實(shí)現(xiàn)基本的質(zhì)量檢測(cè)功能。

同時(shí),GPU的高功耗不僅增加了企業(yè)的用電成本,還會(huì)導(dǎo)致設(shè)備硬件容易因過(guò)熱等問(wèn)題而損壞。相比之下,CPU的功耗較低,運(yùn)行更加穩(wěn)定,能夠有效降低企業(yè)的能耗風(fēng)險(xiǎn)和設(shè)備維護(hù)成本。在長(zhǎng)期運(yùn)行過(guò)程中,這一優(yōu)勢(shì)將為企業(yè)節(jié)省大量的資金和人力投入。

03

快速驗(yàn)證,減少額外投資

利用CPU進(jìn)行AI推理,企業(yè)可以充分挖掘既有平臺(tái)的空閑算力,避免了為新的算力需求而進(jìn)行大規(guī)模的額外投資。在項(xiàng)目的初期驗(yàn)證階段,CPU推理能夠快速搭建起一個(gè)低成本的測(cè)試環(huán)境,幫助企業(yè)快速驗(yàn)證AI算法的可行性和有效性。例如,視覺(jué)團(tuán)隊(duì)可以先在現(xiàn)有的服務(wù)器上利用CPU進(jìn)行算法驗(yàn)證,根據(jù)驗(yàn)證結(jié)果再?zèng)Q定是否需要進(jìn)一步投資更強(qiáng)大的GPU算力。

成功案例

在某膠體檢測(cè)項(xiàng)目中,產(chǎn)品的檢測(cè)項(xiàng)涵蓋少膠、溢膠、斷膠、漏膠等關(guān)鍵指標(biāo)。老設(shè)備方案中,膠水識(shí)別采用的是傳統(tǒng)算法,但在實(shí)際應(yīng)用中,偶爾會(huì)出現(xiàn)定位不準(zhǔn)的問(wèn)題,這對(duì)產(chǎn)品質(zhì)量產(chǎn)生了一定的影響。為了提高檢測(cè)精度,降低過(guò)檢率,企業(yè)決定引入AI檢測(cè)方案。

61824dc0-a761-11ef-8084-92fbcf53809c.png

由于新增GPU需要對(duì)工控機(jī)配置進(jìn)行復(fù)雜的修改,并且采購(gòu)流程耗時(shí)較長(zhǎng),為了確保產(chǎn)線的正常運(yùn)行,不耽誤生產(chǎn)進(jìn)度,項(xiàng)目團(tuán)隊(duì)最終選擇了CPU推理方案。經(jīng)過(guò)實(shí)際測(cè)試和驗(yàn)證,該方案能夠直接上線,并且取得了令人滿意的效果。

618cdeca-a761-11ef-8084-92fbcf53809c.png

在此次項(xiàng)目中,圖像分辨率為1000W,客戶(hù)要求的CT(Cycle Time,周期時(shí)間)為1000ms,而實(shí)際CT時(shí)間僅為500ms,單圖推理時(shí)間更是縮短至100ms,完全滿足了上線要求。這一案例充分證明了阿丘科技AIDI的CPU推理在實(shí)際工業(yè)場(chǎng)景中的可行性和有效性,為其他類(lèi)似項(xiàng)目提供了寶貴的參考經(jīng)驗(yàn)。

綜上,CPU推理作為AI算力配置的新范式,在特定的應(yīng)用場(chǎng)景中展現(xiàn)出了獨(dú)特的優(yōu)勢(shì)。隨著技術(shù)的不斷發(fā)展和優(yōu)化,相信阿丘科技AIDI的CPU推理將在更多領(lǐng)域得到廣泛應(yīng)用,為企業(yè)的智能化轉(zhuǎn)型提供更加經(jīng)濟(jì)、高效的解決方案。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    10863

    瀏覽量

    211743
  • 人工智能
    +關(guān)注

    關(guān)注

    1791

    文章

    47274

    瀏覽量

    238464
  • AI算力
    +關(guān)注

    關(guān)注

    0

    文章

    72

    瀏覽量

    8675
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    企業(yè)AI租賃模式的好處

    構(gòu)建和維護(hù)一個(gè)高效、可擴(kuò)展的AI基礎(chǔ)設(shè)施,不僅需要巨額的初期投資,還涉及復(fù)雜的運(yùn)維管理和持續(xù)的技術(shù)升級(jí)。而AI
    的頭像 發(fā)表于 12-24 10:49 ?65次閱讀

    企業(yè)AI租賃是什么

    企業(yè)AI租賃是指企業(yè)通過(guò)互聯(lián)網(wǎng)向?qū)I(yè)的提供商租用所需的計(jì)算資源,以滿足其AI應(yīng)用的需求。
    的頭像 發(fā)表于 11-14 09:30 ?581次閱讀

    AI推理CPU當(dāng)?shù)?,Arm驅(qū)動(dòng)高效引擎

    AI的訓(xùn)練和推理共同鑄就了其無(wú)與倫比的處理能力。在AI訓(xùn)練方面,GPU因其出色的并行計(jì)算能力贏得了業(yè)界的青睞,成為了當(dāng)前AI大模型最熱門(mén)的芯片;而在
    的頭像 發(fā)表于 11-13 14:34 ?2428次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>推理</b><b class='flag-5'>CPU</b>當(dāng)?shù)?,Arm驅(qū)動(dòng)高效引擎

    AI時(shí)代的重要性及現(xiàn)狀:平衡發(fā)展與優(yōu)化配置的挑戰(zhàn)

    AI時(shí)代,扮演著至關(guān)重要的角色。如果說(shuō)數(shù)據(jù)是AI大模型的“燃料”,那么則是其強(qiáng)大的“動(dòng)
    的頭像 發(fā)表于 11-04 11:45 ?426次閱讀

    GPU開(kāi)發(fā)平臺(tái)是什么

    隨著AI技術(shù)的廣泛應(yīng)用,需求呈現(xiàn)出爆發(fā)式增長(zhǎng)。AI租賃作為一種新興的服務(wù)模式,正逐漸成為
    的頭像 發(fā)表于 10-31 10:31 ?181次閱讀

    【「芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗(yàn)】--全書(shū)概覽

    1章 從TOP500和MLPerf看芯片格局 1.1科學(xué)最前沿TOP500 1.2 AI
    發(fā)表于 10-15 22:08

    青云科技強(qiáng)化AI架構(gòu),升級(jí)產(chǎn)品與服務(wù)體系

    10月9日,青云科技正式揭曉了其升級(jí)版的產(chǎn)品與服務(wù)陣容、行業(yè)及場(chǎng)景定制化解決方案,以及全新的生態(tài)戰(zhàn)略。該公司旨在通過(guò)AI平臺(tái)、AI
    的頭像 發(fā)表于 10-10 16:42 ?478次閱讀

    名單公布!【書(shū)籍評(píng)測(cè)活動(dòng)NO.43】 芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析

    社會(huì)資源和資本力量關(guān)注芯片的發(fā)展,希望我們的國(guó)家能夠更獨(dú)立自主地設(shè)計(jì)制造高性能芯片。 內(nèi)容簡(jiǎn)介: 本書(shū)介紹了超級(jí)計(jì)算機(jī)
    發(fā)表于 09-02 10:09

    大模型時(shí)代的需求

    現(xiàn)在AI已進(jìn)入大模型時(shí)代,各企業(yè)都爭(zhēng)相部署大模型,但如何保證大模型的,以及相關(guān)的穩(wěn)定性和性能,是一個(gè)極為重要的問(wèn)題,帶著這個(gè)極為重要的問(wèn)題,我需要在此書(shū)中找到答案。
    發(fā)表于 08-20 09:04

    如何基于OrangePi?AIpro開(kāi)發(fā)AI推理應(yīng)用

    香橙派AIpro開(kāi)發(fā)板采用昇騰AI技術(shù)路線,接口豐富且具有強(qiáng)大的可擴(kuò)展性,提供8/20TOPS澎湃,可廣泛使用于AI邊緣計(jì)算、深度視覺(jué)學(xué)習(xí)及視頻流
    的頭像 發(fā)表于 06-04 14:23 ?532次閱讀
    如何基于OrangePi?AIpro開(kāi)發(fā)<b class='flag-5'>AI</b><b class='flag-5'>推理</b>應(yīng)用

    中國(guó)移動(dòng)發(fā)布基于飛騰CPU自主研發(fā)的賦能AI時(shí)代的新產(chǎn)品

    4月16日,在中國(guó)南京舉辦的 “2024 全球 6G 技術(shù)大會(huì)”上,中國(guó)移動(dòng)發(fā)布了 基于飛騰 CPU 自主研發(fā)的賦能 AI 時(shí)代的新產(chǎn)品——“靈云” 無(wú)線通
    的頭像 發(fā)表于 04-17 18:12 ?1436次閱讀
    中國(guó)移動(dòng)發(fā)布基于飛騰<b class='flag-5'>CPU</b>自主研發(fā)的賦能<b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>時(shí)代的新產(chǎn)品

    AMD推出銳龍8000嵌入式處理器,AI高達(dá)39 T

    此款CPU選用4納米制程、AMD基于“Zen 4”架構(gòu)的CPU核心以及使用RDNA 3架構(gòu)GPU和XDNA架構(gòu)NPU,實(shí)現(xiàn)高達(dá)39TOPS的AI
    的頭像 發(fā)表于 04-03 10:39 ?885次閱讀

    256Tops!CSA1-N8S1684X服務(wù)器

    (基于BM1684X的高服務(wù)器)高AI處理器BM1684X搭載了BM1684AI
    的頭像 發(fā)表于 03-23 08:02 ?1637次閱讀
    256Tops<b class='flag-5'>算</b><b class='flag-5'>力</b>!CSA1-N8S1684X<b class='flag-5'>算</b><b class='flag-5'>力</b>服務(wù)器

    大茉莉X16-P,5800M大稱(chēng)王稱(chēng)霸

    Rykj365
    發(fā)布于 :2024年01月25日 14:54:52

    立足,聚焦AI!順網(wǎng)科技全面走進(jìn)AI時(shí)代

    “立足,聚焦AI”,順網(wǎng)科技進(jìn)軍AI時(shí)代的號(hào)角已被吹響。 1月18日,順網(wǎng)科技(300113.SZ)以“躍遷·向未來(lái)”為主題的戰(zhàn)略升
    的頭像 發(fā)表于 01-19 10:57 ?461次閱讀
    立足<b class='flag-5'>算</b><b class='flag-5'>力</b>,聚焦<b class='flag-5'>AI</b>!順網(wǎng)科技全面走進(jìn)<b class='flag-5'>AI</b>智<b class='flag-5'>算</b>時(shí)代