0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

為啥軟件成了人工智能加速器致勝的法寶?

pmkA_arm_china ? 來源:YXQ ? 2019-03-27 08:41 ? 次閱讀

隨著Arm生態(tài)系統(tǒng)的發(fā)展壯大,各種各樣的應用場景層出不窮。為了更好地在特定場景下得到更好的性能,能耗比等指標,針對特定應用場景的加速器市場也在蓬勃發(fā)展,近年來火熱的人工智能加速器(Artificial Intelligence Accelerator)就是一個典型例子。

一個高效的加速器,需要精心設計的硬件以及與之搭配的軟件,兩者缺一不可,否則用戶體驗會大打折扣,這也是為什么我們常常看到某些指標非常驚艷的加速器,在實際使用中體驗卻不盡如人意的原因。以人工智能加速器為例,其中基本的硬件加速單元就是乘加器的組合,但如何讓這些乘加器高效地進行并行計算,涉及到上層數(shù)據(jù)的打包、調(diào)度,需要大量的驅(qū)動軟件工作,而且大部分軟件開發(fā)者都是基于某種框架進行應用開發(fā),具體見圖 1,所以驅(qū)動到框架的適配也很重要,甚至有一些框架不能滿足應用的需求,需要專門開辟通道進行優(yōu)化。

圖1:ArmNPU軟硬件框架

開發(fā)一款高性能加速器,需要投入大量人力物力,如果不能大規(guī)模使用,那么投入回報比會大大降低,甚至虧本。如果加速器能和不同Arm系統(tǒng)輕松組合,拓展Arm系統(tǒng)的應用范圍,那么應用場景將會大大增加,生命周期也會延長。讓加速器適配不同的Arm系統(tǒng),這對軟硬件接口和驅(qū)動提出了非常大的挑戰(zhàn),因為今天的Arm產(chǎn)品非常豐富,從低功耗的微處理器,主流的移動平臺,到高端的服務器,高性能計算處理器都有相應產(chǎn)品。對于一個加速器團隊來說,針對盡可能多的Arm配置組合進行開發(fā)驗證成本將非常高昂,這里面不單單涉及IP/EDA的采購,還有系統(tǒng)的搭建維護,但如果沒有這些IP又無法將整個業(yè)務流程完整驗證,甚至影響軟硬件接口的設計優(yōu)化。

有沒有方法高效地解決加速器配套驅(qū)動,框架,應用軟件開發(fā)的問題呢?Fast Model!

圖2:使用DS-5調(diào)試運行在Fast Model中的系統(tǒng)軟件

在Fast Model的例子系統(tǒng)中,Arm給出了一系列Arm核,相關IP組合的子系統(tǒng)模型,以及相應OS,開發(fā)工具DS-5,方便客戶快速搭建軟件開發(fā)平臺,調(diào)整軟硬件接口,進行驅(qū)動以及上層軟件的開發(fā),具體參考圖3。

整個開發(fā)流程如下:

1.在Fast Model的例子系統(tǒng)中找到你需要的平臺,和對應的Bootloader, Firmware,OS軟件,并將他們順利運行

2. 將Fast Model的子系統(tǒng)導出生成SystemC的模型子系統(tǒng)模塊

3. 編寫加速器的功能模型,通過AMBA PV總線和Fast Model導出的子系統(tǒng)模塊進行連接

4. 編寫驅(qū)動在目標OS中操作加速器

5. 在模型平臺上進行軟件框架,應用匹配移植

Arm提供了絕大部分市面可見設計的類似子系統(tǒng),無論是基于Arm v7/v8單核,多核,多cluster系統(tǒng),還是包含最新架構特性的CPU系統(tǒng),加速器開發(fā)團隊都可以在Fast Model的例子程序里面找對類似子系統(tǒng)范例進行適配,在設計之初就可以解決不同系統(tǒng)的適配性問題。Fast Model也提供工具讓開發(fā)者對例子系統(tǒng)進行修改,生成新的子系統(tǒng)以滿足需要。在加速器設計之初,軟件硬件人員就可以一起利用豐富多樣的例子系統(tǒng)進行架構的探索,對穩(wěn)定軟硬件接口非常有幫助,而穩(wěn)定的接口定義對長期的產(chǎn)品演進至關重要。

圖3:基于Fast Model的加速器軟件開發(fā)

至此開發(fā)者已經(jīng)完成了大部軟硬件接口,驅(qū)動以及框架軟件開發(fā)工作,但驅(qū)動中的時序問題還沒有完全解決,因為Fast Model是一款功能型模型,它為了提高運行速度(50-200MHz),犧牲了時序信息。對于時序信息,開發(fā)者可以最后去仿真平臺甚至最終芯片上去調(diào)節(jié),而此時軟件測試用例和框架都已經(jīng)完成,這將大大節(jié)省占用仿真平臺(MHz)進行調(diào)試排錯的時間,從而降低成本。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 軟件
    +關注

    關注

    69

    文章

    4998

    瀏覽量

    87888
  • 人工智能
    +關注

    關注

    1793

    文章

    47588

    瀏覽量

    239465

原文標題:為何軟件是人工智能加速器致勝的秘密?

文章出處:【微信號:arm_china,微信公眾號:Arm芯聞】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關推薦

    從版本控制到全流程支持:揭秘Helix Core如何成為您的創(chuàng)意加速器

    加速器
    龍智DevSecOps
    發(fā)布于 :2024年11月26日 13:42:47

    嵌入式和人工智能究竟是什么關系?

    人工智能的結合,無疑是科技發(fā)展中的一場革命。在人工智能硬件加速中,嵌入式系統(tǒng)以其獨特的優(yōu)勢和重要性,發(fā)揮著不可或缺的作用。通過深度學習和神經(jīng)網(wǎng)絡等算法,嵌入式系統(tǒng)能夠高效地處理大量數(shù)據(jù),從而實現(xiàn)
    發(fā)表于 11-14 16:39

    微軟攜手英偉達與GitHub推出生成式AI加速器

    近日,微軟宣布在英國推出一項重大合作項目——生成式人工智能加速器。這一項目由微軟、英偉達和GitHub三家科技巨頭強強聯(lián)手,旨在加速生成式人工智能技術的研發(fā)與應用。 生成式
    的頭像 發(fā)表于 11-05 14:58 ?441次閱讀

    AI for Science:人工智能驅(qū)動科學創(chuàng)新》第4章-AI與生命科學讀后感

    閱讀這一章后,我深感人工智能與生命科學的結合正引領著一場前所未有的科學革命,以下是我個人的讀后感: 1. 技術革新與生命科學進步 這一章詳細闡述了人工智能如何通過其強大的數(shù)據(jù)處理和分析能力,加速生命科學
    發(fā)表于 10-14 09:21

    《AI for Science:人工智能驅(qū)動科學創(chuàng)新》第一章人工智能驅(qū)動的科學創(chuàng)新學習心得

    人工智能:科學研究的加速器 第一章清晰地闡述了人工智能作為科學研究工具的強大功能。通過機器學習、深度學習等先進技術,AI能夠處理和分析海量數(shù)據(jù),發(fā)現(xiàn)傳統(tǒng)方法難以捕捉的模式和規(guī)律。這不僅極大地提高了數(shù)據(jù)處理
    發(fā)表于 10-14 09:12

    Samtec AI 應用詳述 | 人工智能加速器所需的連接

    數(shù)據(jù)挖掘、人工智能、機器學習、商業(yè)分析。 高性能互連是中央處理(CPU)和人工智能加速器之間的紐帶,在實現(xiàn)這些系統(tǒng)所需的可擴展性和靈活性方面發(fā)揮著至關重要的作用。 今天,我們將在文章
    發(fā)表于 09-29 13:44 ?761次閱讀
    Samtec AI 應用詳述 | <b class='flag-5'>人工智能</b><b class='flag-5'>加速器</b>所需的連接<b class='flag-5'>器</b>

    risc-v在人工智能圖像處理應用前景分析

    長時間運行或電池供電的設備尤為重要。 高性能 : 盡管RISC-V架構以低功耗著稱,但其高性能也不容忽視。通過優(yōu)化指令集和處理設計,RISC-V可以在處理復雜的人工智能圖像處理任務時表現(xiàn)出色。 三
    發(fā)表于 09-28 11:00

    FPGA在人工智能中的應用有哪些?

    FPGA(現(xiàn)場可編程門陣列)在人工智能領域的應用非常廣泛,主要體現(xiàn)在以下幾個方面: 一、深度學習加速 訓練和推理過程加速:FPGA可以用來加速深度學習的訓練和推理過程。由于其高并行性和
    發(fā)表于 07-29 17:05

    KAIST開發(fā)出高性能人工智能加速器技術

    人工智能(AI)技術日新月異的今天,大規(guī)模AI模型的部署與應用正以前所未有的速度推動著科技進步與產(chǎn)業(yè)升級。然而,隨著模型復雜度和數(shù)據(jù)量的爆炸式增長,對計算資源尤其是內(nèi)存容量的需求也急劇攀升,成為
    的頭像 發(fā)表于 07-12 09:59 ?574次閱讀

    Hailo獲1.2億美元新融資,首發(fā)AI加速器Hailo-10,助力邊緣設備實現(xiàn)生成式人工智能

    摘要:隨著Hailo推出最新的人工智能加速器,其融資總額現(xiàn)已突破3.4億美元。這款專為個人計算機和汽車行業(yè)打造的人工智能加速器,以出色的低功耗性能處理大型語言模型(LLM),成功將生成
    的頭像 發(fā)表于 04-03 11:57 ?363次閱讀

    5G智能物聯(lián)網(wǎng)課程之Aidlux下人工智能開發(fā)(SC171開發(fā)套件V1)

    .pdf 人工智能 軟件平臺使用指導A:AidLux平臺介紹 8分29秒 https://t.elecfans.com/v/25505.html *附件:AidLux平臺使用介紹.pdf 人工智能
    發(fā)表于 04-01 10:40

    瑞薩發(fā)布下一代動態(tài)可重構人工智能處理加速器

    瑞薩最新發(fā)布的動態(tài)可重構人工智能處理(DRP-AI)加速器,在業(yè)界引起了廣泛關注。這款加速器擁有卓越的10 TOPS/W高功率效率,相比傳統(tǒng)技術,效率提升了驚人的10倍。其獨特之處在
    的頭像 發(fā)表于 03-08 13:45 ?810次閱讀

    Tenstorrent將為日本LSTC新型邊緣2納米AI加速器開發(fā)芯片

    加拿大AI芯片領域的初創(chuàng)公司Tenstorrent與日本尖端半導體技術中心(LSTC)達成了一項多層次合作協(xié)議。根據(jù)協(xié)議內(nèi)容,LSTC將采用Tenstorrent的世界級RISC-V架構和芯片IP來開發(fā)其新型邊緣2納米人工智能加速器
    的頭像 發(fā)表于 02-28 10:49 ?729次閱讀

    嵌入式人工智能的就業(yè)方向有哪些?

    嵌入式人工智能的就業(yè)方向有哪些? 在新一輪科技革命與產(chǎn)業(yè)變革的時代背景下,嵌入式人工智能成為國家新型基礎建設與傳統(tǒng)產(chǎn)業(yè)升級的核心驅(qū)動力。同時在此背景驅(qū)動下,眾多名企也紛紛在嵌入式人工智能領域布局
    發(fā)表于 02-26 10:17

    家居智能化,推動AI加速器的發(fā)展

    電子發(fā)燒友網(wǎng)報道(文/黃山明)AI加速芯片,也稱為人工智能加速器(AI Accelerator),是一種專為執(zhí)行機器學習和深度學習任務而設計的ASIC或定制化處理。在
    的頭像 發(fā)表于 02-23 00:18 ?4637次閱讀