0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
电子发烧友
开通电子发烧友VIP会员 尊享10大特权
海量资料免费下载
精品直播免费看
优质内容免费畅学
课程9折专享价
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

為你的AI芯片從FPGA走向ASIC?

FPGA設(shè)計(jì)論壇 ? 來源:未知 ? 2023-11-24 15:30 ? 次閱讀
也許你正在為邊緣計(jì)算設(shè)計(jì)一個(gè)嵌入式推理引擎?;蛘吣谄囈曈X處理方面邁出下一步。又或許你有可以在數(shù)據(jù)中心挑戰(zhàn)英偉達(dá)和谷歌的洞察力。在廣泛的性能需求、環(huán)境和應(yīng)用中,人工智能加速器架構(gòu)不僅在設(shè)計(jì)方面,而且在驗(yàn)證和實(shí)施方面都提出了獨(dú)特的挑戰(zhàn)。從一種架構(gòu)轉(zhuǎn)移到FPGA——這幾乎是這個(gè)領(lǐng)域的一個(gè)強(qiáng)制性步驟——然后轉(zhuǎn)移到生產(chǎn)ASIC是一個(gè)不平凡的旅程。但是如果你提前計(jì)劃,這不一定是一次冒險(xiǎn)。

如果您選擇——大多數(shù)團(tuán)隊(duì)都會(huì)選擇——用FPGAs進(jìn)行概念驗(yàn)證或驗(yàn)證平臺(tái),那么從一開始,您就會(huì)被同時(shí)拉向三個(gè)方向,如圖1所示。架構(gòu)師希望您的FPGA實(shí)現(xiàn)盡可能接近他們的微架構(gòu)。對(duì)他們來說,關(guān)鍵是看設(shè)計(jì)如何有效地實(shí)現(xiàn)他們的算法。但是,軟件團(tuán)隊(duì)會(huì)督促您針對(duì)性能優(yōu)化FPGA設(shè)計(jì)。這意味著改變架構(gòu)以適應(yīng)所選FPGA芯片的優(yōu)勢(shì)和限制。你可以依靠營(yíng)銷來增加這種壓力——主要是如果他們的計(jì)劃包括早期進(jìn)入FPGAs市場(chǎng)。存在這樣一種風(fēng)險(xiǎn),即概念的證明會(huì)像科學(xué)怪人一樣,有自己的生命。

wKgZomVgUiaAUehzAAOVaW22ZkU708.png

圖1:如果你選擇在FPGAs中做一個(gè)概念驗(yàn)證或驗(yàn)證平臺(tái),你會(huì)被拉向三個(gè)方向:來自架構(gòu)師、軟件團(tuán)隊(duì)和生產(chǎn)需求。

第三,需要將設(shè)計(jì)移植到ASIC上進(jìn)行批量生產(chǎn)。這將為您帶來競(jìng)爭(zhēng)力所需的性能、動(dòng)力和面積。理想情況下,ASIC設(shè)計(jì)將準(zhǔn)確反映最初的理論架構(gòu),并針對(duì)您選擇的ASIC工藝和IP庫(kù)進(jìn)行優(yōu)化。通過轉(zhuǎn)換成熟的FPGA設(shè)計(jì),您可以在多大程度上獲得ASIC設(shè)計(jì),這是一個(gè)至關(guān)重要的問題。答案將取決于架構(gòu)師、FPGA和ASIC團(tuán)隊(duì)合作的緊密程度。

也許支持這種說法的最好方式是看看一些區(qū)分人工智能加速器的架構(gòu)特征,并在設(shè)計(jì)過程中遵循它們。

并行處理是人工智能加速器的基礎(chǔ)。它可以通過大量小型專用處理核心來實(shí)現(xiàn),如特定算法的GPU?;蛘咚梢砸詳?shù)據(jù)流的方式完成:專用處理器的流水線。這兩種架構(gòu)都給FPGA實(shí)現(xiàn)帶來了挑戰(zhàn)。

設(shè)計(jì)者可以在RTL對(duì)處理元件及其互連進(jìn)行編碼,并將RTL交給FPGA設(shè)計(jì)工具。但是,要獲得具有足夠設(shè)備利用率和性能的設(shè)計(jì)——獲得接近100%的布線——通常至少需要在平面規(guī)劃和布局方面進(jìn)行人工干預(yù)。

這種規(guī)劃必須關(guān)注FPGA中資源的可用性和位置,而不是加速器的原始架構(gòu)。例如,該體系結(jié)構(gòu)可能希望計(jì)算元素群集在本地組中。然而,F(xiàn)PGA可能要求您將計(jì)算元素分散在整個(gè)芯片中,甚至將它們分成更小的模塊,以確保足夠的路由和RAM資源。這可能需要改變互連架構(gòu),例如改變總線結(jié)構(gòu)。

還會(huì)出現(xiàn)其他選擇。例如,深度學(xué)習(xí)推理加速器的設(shè)計(jì)師經(jīng)常使用精度降低的算法——比如8位而不是32位——來提高速度和節(jié)省能源。但出于性能和資源的原因,F(xiàn)PGA團(tuán)隊(duì)可能希望使用FPGA的32位乘累加硬宏,而不是由邏輯單元構(gòu)造的8位乘法器。這種選擇會(huì)使FPGA設(shè)計(jì)逐漸偏離原始架構(gòu),并影響轉(zhuǎn)換過程。

ASIC轉(zhuǎn)換

然后,是時(shí)候?qū)?shí)現(xiàn)轉(zhuǎn)移到ASIC上了。在小型、簡(jiǎn)單的SOC中,F(xiàn)PGA到ASIC的轉(zhuǎn)換意味著一個(gè)近乎機(jī)械的逐步過程。拿出任何特殊的FPGA功能,如乘法累加模塊、高速串行接口、PCIe接口和DRAM控制器。用功能等同的ASIC IP替換它們,并對(duì)內(nèi)部總線或接口進(jìn)行任何必要的更改以連接它們。為了重新合成邏輯,插入新的時(shí)鐘網(wǎng)和自測(cè)結(jié)構(gòu),分配功率,并進(jìn)行驗(yàn)證。

這對(duì)于人工智能加速器來說仍然是可行的。在FPGA中工作的任何東西都可以通過這種方式轉(zhuǎn)移到ASIC中。但是,您為優(yōu)化FPGA設(shè)計(jì)所做的設(shè)計(jì)更改呢?由于ASIC中有基本上無限的邏輯和路由資源以及大量的第三方IP庫(kù),這些針對(duì)FPGA的更改將是不必要的,甚至可能適得其反。

進(jìn)行轉(zhuǎn)換的團(tuán)隊(duì)必須理解最初的設(shè)計(jì)意圖,這樣他們才能根據(jù)具體情況決定是使用FPGA設(shè)計(jì)還是恢復(fù)最初的架構(gòu)。這對(duì)于確定合成哪個(gè)代碼和選擇如何最好地使用IP是正確的。

再舉兩個(gè)例子可能會(huì)有幫助。首先是記憶。由于它們的并行架構(gòu),AI加速器通常在處理元件內(nèi)部或之間采用許多不同形狀、大小、類型和速度的小型RAM實(shí)例。這種做法完全符合ASIC設(shè)計(jì)的優(yōu)勢(shì),但它可能會(huì)對(duì)FPGA造成嚴(yán)重破壞。雖然可以將各組FPGA邏輯單元轉(zhuǎn)換成邏輯結(jié)構(gòu)中的小RAM,但設(shè)計(jì)人員通常會(huì)在FPGA中使用大型硬連線可配置RAM模塊。這給FPGA團(tuán)隊(duì)留下了兩個(gè)選擇:要么修改原始架構(gòu),使用大的共享RAM塊,而不是許多較小的塊,要么設(shè)計(jì)一個(gè)包裝FPGA的大塊RAM的包裝器,以仿真一組較小的實(shí)例,希望不會(huì)耗盡塊RAM附近的路由資源。

wKgZomVgUieAAWCXAANEL32WgwI098.png

圖2:從FPGA遷移到ASIC提供了更多選擇。決策取決于對(duì)設(shè)計(jì)意圖的清晰理解。

當(dāng)從FPGA轉(zhuǎn)移到ASIC時(shí),有更多的選擇,如圖2所示。轉(zhuǎn)換團(tuán)隊(duì)?wèi)?yīng)該直接轉(zhuǎn)換FPGA設(shè)計(jì)嗎?經(jīng)驗(yàn)豐富的轉(zhuǎn)換供應(yīng)商在ASIC設(shè)計(jì)中實(shí)現(xiàn)FPGA模塊RAM的功能不會(huì)有任何問題?;蛘邎F(tuán)隊(duì)?wèi)?yīng)該恢復(fù)到具有許多分散的RAM實(shí)例的原始架構(gòu)?更小的ram將更快、更節(jié)能,并可能恢復(fù)原始架構(gòu)的數(shù)據(jù)流,消除可能的內(nèi)存瓶頸。然而,決策取決于對(duì)設(shè)計(jì)意圖的清晰理解。

多合一

還有多個(gè)FPGAs的問題。許多加速器設(shè)計(jì)對(duì)于單個(gè)FPGA來說太大,必須分布在多個(gè)芯片上。這些芯片如何相互通信將影響轉(zhuǎn)換過程。

例如,如果FPGA通過諸如存儲(chǔ)器總線的高速并行總線鏈接,設(shè)計(jì)者可以將所有FPGA的內(nèi)容放入ASIC中,通過相同的并行總線排列鏈接。假設(shè)FPGAs通過類似PCIe的東西連接。在這種情況下,設(shè)計(jì)人員將不得不移除PCI接口,并根據(jù)模塊間數(shù)據(jù)流的性質(zhì),用直接并行連接或可能的片上網(wǎng)絡(luò)來取代它們。重要的是要回顧原始架構(gòu),看看它是否被修改以適應(yīng)芯片到芯片接口的插入——例如,通過插入大緩沖存儲(chǔ)器或創(chuàng)建消息傳遞協(xié)議——并消除這些修改。

密切的合作

一旦功能設(shè)計(jì)完成,工作就可以進(jìn)入時(shí)鐘架構(gòu)了。這里,ASIC也不受FPGAs的限制。轉(zhuǎn)換團(tuán)隊(duì)可以研究原始架構(gòu)的工作原理,并利用它為本地時(shí)鐘區(qū)域、門控和頻移提供的所有機(jī)會(huì),所有這些在ASIC領(lǐng)域都是現(xiàn)成的。

wKgZomVgUieAdZe8AANLDJGSRCw549.png

圖3:該表列出了FPGA到ASIC轉(zhuǎn)換過程中的每個(gè)步驟,并指明了負(fù)責(zé)執(zhí)行該步驟的人員。

同樣,經(jīng)驗(yàn)豐富的轉(zhuǎn)換團(tuán)隊(duì)可以利用他們對(duì)設(shè)計(jì)意圖的理解和對(duì)測(cè)試供應(yīng)商能力的了解,利用加速器的并行架構(gòu)來實(shí)施并行內(nèi)置自測(cè)。這種優(yōu)化超越了ASIC設(shè)計(jì),深入到供應(yīng)鏈中。做得好的話,它將大幅降低測(cè)試成本,顯著節(jié)約整體單位成本,如圖3所示。

我們已經(jīng)看到,將AI加速器設(shè)計(jì)從中間FPGAs轉(zhuǎn)換為ASIC幾乎是一個(gè)機(jī)械的過程。但由于人工智能高度并行加速器的性質(zhì),理解原始設(shè)計(jì)意圖和架構(gòu)微妙之處、能夠識(shí)別FPGA特定優(yōu)化、擁有人工智能芯片經(jīng)驗(yàn)、能夠在客戶和供應(yīng)商專家之間自由分配任務(wù)的轉(zhuǎn)換團(tuán)隊(duì)可以實(shí)現(xiàn)更好的結(jié)果。從一開始,具有出色功率、性能和面積的ASIC就是設(shè)計(jì)的全部?jī)?nèi)容。

wKgZomVgUieAMdHLAABUdafP6GM765.jpg

精彩推薦 至芯科技FPGA就業(yè)培訓(xùn)班——助你步入成功之路、11月30號(hào)北京中心開課、歡迎咨詢! 基于LVDS的高速串行數(shù)據(jù)傳輸系統(tǒng)設(shè)計(jì) FPGA學(xué)習(xí)-異步FIFO原型設(shè)計(jì)與驗(yàn)證掃碼加微信邀請(qǐng)您加入FPGA學(xué)習(xí)交流群

wKgZomVgUieAEM_jAABiq3a-ogY449.jpgwKgZomVgUieAaUndAAACXWrmhKE260.png

歡迎加入至芯科技FPGA微信學(xué)習(xí)交流群,這里有一群優(yōu)秀的FPGA工程師、學(xué)生、老師、這里FPGA技術(shù)交流學(xué)習(xí)氛圍濃厚、相互分享、相互幫助、叫上小伙伴一起加入吧!

點(diǎn)個(gè)在看你最好看


原文標(biāo)題:為你的AI芯片從FPGA走向ASIC?

文章出處:【微信公眾號(hào):FPGA設(shè)計(jì)論壇】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • FPGA
    +關(guān)注

    關(guān)注

    1641

    文章

    21910

    瀏覽量

    611619

原文標(biāo)題:為你的AI芯片從FPGA走向ASIC?

文章出處:【微信號(hào):gh_9d70b445f494,微信公眾號(hào):FPGA設(shè)計(jì)論壇】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    FPGA+AI王炸組合如何重塑未來世界:看看DeepSeek東方神秘力量如何預(yù)測(cè)......

    ASIC、GPU)與FPGA的協(xié)同工作模式,例如通過芯片合封或系統(tǒng)集成,實(shí)現(xiàn)高性能的AI推理。 3.利用FPGA的獨(dú)特優(yōu)勢(shì)? 實(shí)時(shí)性與低延遲
    發(fā)表于 03-03 11:21

    AI推理帶火的ASIC,開發(fā)成敗在此一舉!

    電子發(fā)燒友網(wǎng)報(bào)道(文/梁浩斌)去年年底,多家大廠爆出開發(fā)數(shù)據(jù)中心ASIC芯片的消息,包括傳聞蘋果與博通合作開發(fā)面向AI推理的ASIC,亞馬遜也在年底公布了其
    的頭像 發(fā)表于 03-03 00:13 ?2566次閱讀
    <b class='flag-5'>AI</b>推理帶火的<b class='flag-5'>ASIC</b>,開發(fā)成敗在此一舉!

    ASIC和GPU的原理和優(yōu)勢(shì)

    ? 本文介紹了ASIC和GPU兩種能夠用于AI計(jì)算的半導(dǎo)體芯片各自的原理和優(yōu)勢(shì)。 ASIC和GPU是什么 ASIC和GPU,都是用于計(jì)算功能
    的頭像 發(fā)表于 01-06 13:58 ?1245次閱讀
    <b class='flag-5'>ASIC</b>和GPU的原理和優(yōu)勢(shì)

    ASIC芯片會(huì)成為AI的下一件大事嗎

    當(dāng)谷歌宣布其第二代專用集成電路來加速公司的機(jī)器學(xué)習(xí)處理時(shí),筆者的電話開始響個(gè)不停,問這對(duì)半導(dǎo)體行業(yè)的潛在影響。世界上最大的數(shù)據(jù)中心“Super?7”的其它成員是否都急于AI制造自己的芯片?這對(duì)
    的頭像 發(fā)表于 01-02 09:33 ?461次閱讀
    <b class='flag-5'>ASIC</b><b class='flag-5'>芯片</b>會(huì)成為<b class='flag-5'>AI</b>的下一件大事嗎

    大多數(shù)FPGA的程序存儲(chǔ)器(FLASH)為什么都放在外面呢?FPGA的主要應(yīng)用

    電子產(chǎn)品市場(chǎng)幾乎難以看到FPGA的使用,幾乎全是專用集成電路(ASIC芯片,就是我們常說的定制芯片,為什么FPGA的應(yīng)用會(huì)這么的少,因?yàn)閷?/div>
    的頭像 發(fā)表于 12-24 11:04 ?917次閱讀
    大多數(shù)<b class='flag-5'>FPGA</b>的程序存儲(chǔ)器(FLASH)為什么都放在外面呢?<b class='flag-5'>FPGA</b>的主要應(yīng)用

    FPGAASIC的區(qū)別 FPGA性能優(yōu)化技巧

    編程來配置以實(shí)現(xiàn)特定的功能 特定應(yīng)用定制設(shè)計(jì)的集成電路,需要根據(jù)特定的需求從頭開始設(shè)計(jì)和制造 設(shè)計(jì)與制造 預(yù)先制造好,用戶可以根據(jù)需要通過編程來定制其功能 設(shè)計(jì)和制造過程是一次性的,一旦制造完成,其功能就固定了 成本 包括購(gòu)買FPGA
    的頭像 發(fā)表于 12-02 09:51 ?721次閱讀

    ASIC集成電路與通用芯片的比較

    ASIC集成電路與通用芯片在多個(gè)方面存在顯著差異。以下是對(duì)這兩者的比較: 一、定義與用途 ASIC集成電路 :ASIC(Application-Specific Integrated
    的頭像 發(fā)表于 11-20 15:56 ?1621次閱讀

    ASIC集成電路與FPGA的區(qū)別

    ASIC(專用集成電路)與FPGA(現(xiàn)場(chǎng)可編程門陣列)是兩種不同的集成電路技術(shù),它們?cè)诙鄠€(gè)方面存在顯著的區(qū)別。以下是兩者的主要差異: 一、設(shè)計(jì)與制造 ASIC特定應(yīng)用定制設(shè)計(jì)的集
    的頭像 發(fā)表于 11-20 15:02 ?894次閱讀

    FPGAASIC在大模型推理加速中的應(yīng)用

    隨著現(xiàn)在AI的快速發(fā)展,使用FPGAASIC進(jìn)行推理加速的研究也越來越多,目前的市場(chǎng)來說,有些公司已經(jīng)有了專門做推理的ASIC,像Gro
    的頭像 發(fā)表于 10-29 14:12 ?1560次閱讀
    <b class='flag-5'>FPGA</b>和<b class='flag-5'>ASIC</b>在大模型推理加速中的應(yīng)用

    FPGAASIC的優(yōu)缺點(diǎn)比較

    FPGA(現(xiàn)場(chǎng)可編程門陣列)與ASIC(專用集成電路)是兩種不同的硬件實(shí)現(xiàn)方式,各自具有獨(dú)特的優(yōu)缺點(diǎn)。以下是對(duì)兩者優(yōu)缺點(diǎn)的比較: FPGA的優(yōu)點(diǎn) 可編程性強(qiáng) :FPGA具有高度的可編程
    的頭像 發(fā)表于 10-25 09:24 ?1368次閱讀

    低功耗FPGA、處理器和ASIC實(shí)施啟用LVDS鏈路

    電子發(fā)燒友網(wǎng)站提供《低功耗FPGA、處理器和ASIC實(shí)施啟用LVDS鏈路.pdf》資料免費(fèi)下載
    發(fā)表于 08-29 09:59 ?0次下載
    <b class='flag-5'>為</b>低功耗<b class='flag-5'>FPGA</b>、處理器和<b class='flag-5'>ASIC</b>實(shí)施啟用LVDS鏈路

    AI芯片的混合精度計(jì)算與靈活可擴(kuò)展

    電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)當(dāng)前,AI技術(shù)和應(yīng)用蓬勃發(fā)展,其中離不開AI芯片的支持。AI芯片是一個(gè)復(fù)雜而多樣的領(lǐng)域,根據(jù)其設(shè)計(jì)目標(biāo)和應(yīng)用場(chǎng)
    的頭像 發(fā)表于 08-23 00:08 ?5587次閱讀

    自動(dòng)駕駛?cè)笾髁?b class='flag-5'>芯片架構(gòu)分析

    當(dāng)前主流的AI芯片主要分為三類,GPU、FPGA、ASIC。GPU、FPGA均是前期較為成熟的芯片
    的頭像 發(fā)表于 08-19 17:11 ?2076次閱讀
    自動(dòng)駕駛?cè)笾髁?b class='flag-5'>芯片</b>架構(gòu)分析

    ASIC IP核移植到FPGA上——更新概念并推動(dòng)改變以完成充滿挑戰(zhàn)的任務(wù)!

    本系列文章數(shù)字芯片設(shè)計(jì)項(xiàng)目技術(shù)總監(jiān)的角度出發(fā),介紹了如何將芯片的產(chǎn)品定義與設(shè)計(jì)和驗(yàn)證規(guī)劃進(jìn)行結(jié)合,詳細(xì)講述了在FPGA上使用IP核來開發(fā)ASIC
    的頭像 發(fā)表于 08-10 17:13 ?979次閱讀
    將<b class='flag-5'>ASIC</b> IP核移植到<b class='flag-5'>FPGA</b>上——更新概念并推動(dòng)改變以完成充滿挑戰(zhàn)的任務(wù)!

    科普 | 一文了解FPGA

    市場(chǎng)基礎(chǔ)。由于 ASIC 具有明顯的規(guī)模經(jīng)濟(jì),當(dāng)單一芯片產(chǎn)品用量極大時(shí)(一般超過 10 萬片),使用 ASIC 方案將有成本優(yōu)勢(shì),因此 FPGA
    發(fā)表于 07-08 19:36

    電子發(fā)燒友

    中國(guó)電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會(huì)員交流學(xué)習(xí)
    • 獲取您個(gè)性化的科技前沿技術(shù)信息
    • 參加活動(dòng)獲取豐厚的禮品