電子發(fā)燒友網(wǎng)報道(文/李彎彎)近些年AI模型的應用場景飛速擴展,包括自動駕駛、智慧城市、教育、醫(yī)療、金融等等,行業(yè)的多樣性和應用場景的分散,使得AI模型爆炸式增長。
在日前某論壇上,商湯科技聯(lián)合創(chuàng)始人兼大裝置首席科學家林大華談到,商湯科技每年要生產(chǎn)幾萬個AI模型,然而模型豐富,算子的長尾效應也很明顯,10% 經(jīng)典算子雖然占據(jù)90% AI芯片算力,而90%長尾算子卻占據(jù)大量計算時間。
多元化的應用催生了多樣的算法框架,算法支持應用,而算法框架是將算法用于解決實際問題,助力AI芯片算力價值體現(xiàn),充當AI芯片與應用的橋梁。
比如說算法就是諸如LR、GBDT、DNN、DeepFM這樣的實際解決某個數(shù)學問題的公式實現(xiàn)。算法框架可以讓算法執(zhí)行更高效,比如最早玩深度學習的人都用Theano,基于Theano去開發(fā)算法很困難,后來有了PyTorch和TensorFlow,讓基于深度學習的算法開發(fā)更方便。
目前算法框架已經(jīng)非常豐富,包括PyTorch、TensorFlow,還有商湯科技開源的Sense Parrots,華為開源的昇思MindSpore,百度飛槳PaddlePaddle等等。
算法工程師其實是基于算法框架開發(fā)AI算法的,也就是說深度學習框架銜接起了硬件芯片算力和上面AI算法應用,然而AI訓練框架逐漸豐富,但未形成統(tǒng)一的芯片接口,這使得AI訓練芯片對框架逐一適配的成本高昂,這也阻礙了AI芯片在市場應用上的快速迭代。
為此,商湯科技希望基于已經(jīng)開源開放的算法體系,構(gòu)建統(tǒng)一的接口,把大家協(xié)同在一起,在軟件層面,在算法的結(jié)構(gòu)分解出一些標準算子,表明哪些算子在哪些應用場景中最為重要,這樣可以讓大家能夠把有限的適配資源,投放到更有用的地方。
商湯給出的軟件解決方案包括了算法分級體系和標準算子接口體系。據(jù)林大華介紹,算法分級體系首先是從影響力、性能、部署特性三個維度,即算法模型在學術(shù)界和工業(yè)界的影響力,算法模型的精度和速度,以及算法模型的部署友好性,將AI算法進行分級,這樣可以給出方向性的應用參考。
接著是卷積輸入配置頻率統(tǒng)計,每個算法模型在實際訓練中存在不同的卷積輸入參數(shù)配置,不同參數(shù)配置的卷積算子使用頻率存在較大的差異。
再得出高優(yōu)Spec優(yōu)化清單,從算法模型優(yōu)先級評估+模型卷積輸入配置頻率,得到模型重要性和卷積輸入配置頻率加權(quán)評分,再得到高優(yōu)Spec優(yōu)化清單,芯片廠商可參考優(yōu)化的清單進行針對性優(yōu)化。
總之,基于算法分級體系的算子優(yōu)化方法可以助力挖掘高優(yōu)Spec,確認常用卷積輸入配置優(yōu)化優(yōu)先級,提高芯片廠商適配能效。
長尾算子在實際應用中占比非常高,但卻不在標準算法庫里面,因此需要建立標準算子接口來提升芯片和框架的適配。
標準算子接口體系,包括統(tǒng)一算子接口及函數(shù)簽名和一致性測試套件。主要特點是,不依賴具體的框架和芯片,邏輯簡單、易閱讀、易擴展,與標準接口定義保持一致,具有可移植性和強適用性,提供一致性的錯誤處理機制,支持主流開發(fā)框架和應用模型。
傳統(tǒng)芯片和框架適配流程,存在這樣的問題:1、廠商合作前溝通成本高;2、適配工作量難度高,風險難以控制;3、適配案例和經(jīng)驗難以復用到其它芯片和框架適配場景中。而接入標準算子接口體系的芯片和框架適配流程,有幾個優(yōu)點:1、廠商合作前沒有額外溝通成本;2、工作量小、難度低,風險可控;3、一次接入即可完成對主流芯片、框架適配場景的支持。
整體而言,近些年AI產(chǎn)業(yè)在芯片算力、算法、框架,以及應用方面都有很大的進步,然而如果AI產(chǎn)業(yè)要長期健康的發(fā)展,還需要上下游機構(gòu)、廠商一起,攜手合作構(gòu)建出一個繁榮的生態(tài),這中間的算法框架在連接起底層芯片和上層業(yè)務方面,承擔著重要責任。
在日前某論壇上,商湯科技聯(lián)合創(chuàng)始人兼大裝置首席科學家林大華談到,商湯科技每年要生產(chǎn)幾萬個AI模型,然而模型豐富,算子的長尾效應也很明顯,10% 經(jīng)典算子雖然占據(jù)90% AI芯片算力,而90%長尾算子卻占據(jù)大量計算時間。
多元化的應用催生了多樣的算法框架,算法支持應用,而算法框架是將算法用于解決實際問題,助力AI芯片算力價值體現(xiàn),充當AI芯片與應用的橋梁。
比如說算法就是諸如LR、GBDT、DNN、DeepFM這樣的實際解決某個數(shù)學問題的公式實現(xiàn)。算法框架可以讓算法執(zhí)行更高效,比如最早玩深度學習的人都用Theano,基于Theano去開發(fā)算法很困難,后來有了PyTorch和TensorFlow,讓基于深度學習的算法開發(fā)更方便。
目前算法框架已經(jīng)非常豐富,包括PyTorch、TensorFlow,還有商湯科技開源的Sense Parrots,華為開源的昇思MindSpore,百度飛槳PaddlePaddle等等。
算法工程師其實是基于算法框架開發(fā)AI算法的,也就是說深度學習框架銜接起了硬件芯片算力和上面AI算法應用,然而AI訓練框架逐漸豐富,但未形成統(tǒng)一的芯片接口,這使得AI訓練芯片對框架逐一適配的成本高昂,這也阻礙了AI芯片在市場應用上的快速迭代。
為此,商湯科技希望基于已經(jīng)開源開放的算法體系,構(gòu)建統(tǒng)一的接口,把大家協(xié)同在一起,在軟件層面,在算法的結(jié)構(gòu)分解出一些標準算子,表明哪些算子在哪些應用場景中最為重要,這樣可以讓大家能夠把有限的適配資源,投放到更有用的地方。
商湯給出的軟件解決方案包括了算法分級體系和標準算子接口體系。據(jù)林大華介紹,算法分級體系首先是從影響力、性能、部署特性三個維度,即算法模型在學術(shù)界和工業(yè)界的影響力,算法模型的精度和速度,以及算法模型的部署友好性,將AI算法進行分級,這樣可以給出方向性的應用參考。
接著是卷積輸入配置頻率統(tǒng)計,每個算法模型在實際訓練中存在不同的卷積輸入參數(shù)配置,不同參數(shù)配置的卷積算子使用頻率存在較大的差異。
再得出高優(yōu)Spec優(yōu)化清單,從算法模型優(yōu)先級評估+模型卷積輸入配置頻率,得到模型重要性和卷積輸入配置頻率加權(quán)評分,再得到高優(yōu)Spec優(yōu)化清單,芯片廠商可參考優(yōu)化的清單進行針對性優(yōu)化。
總之,基于算法分級體系的算子優(yōu)化方法可以助力挖掘高優(yōu)Spec,確認常用卷積輸入配置優(yōu)化優(yōu)先級,提高芯片廠商適配能效。
長尾算子在實際應用中占比非常高,但卻不在標準算法庫里面,因此需要建立標準算子接口來提升芯片和框架的適配。
標準算子接口體系,包括統(tǒng)一算子接口及函數(shù)簽名和一致性測試套件。主要特點是,不依賴具體的框架和芯片,邏輯簡單、易閱讀、易擴展,與標準接口定義保持一致,具有可移植性和強適用性,提供一致性的錯誤處理機制,支持主流開發(fā)框架和應用模型。
傳統(tǒng)芯片和框架適配流程,存在這樣的問題:1、廠商合作前溝通成本高;2、適配工作量難度高,風險難以控制;3、適配案例和經(jīng)驗難以復用到其它芯片和框架適配場景中。而接入標準算子接口體系的芯片和框架適配流程,有幾個優(yōu)點:1、廠商合作前沒有額外溝通成本;2、工作量小、難度低,風險可控;3、一次接入即可完成對主流芯片、框架適配場景的支持。
整體而言,近些年AI產(chǎn)業(yè)在芯片算力、算法、框架,以及應用方面都有很大的進步,然而如果AI產(chǎn)業(yè)要長期健康的發(fā)展,還需要上下游機構(gòu)、廠商一起,攜手合作構(gòu)建出一個繁榮的生態(tài),這中間的算法框架在連接起底層芯片和上層業(yè)務方面,承擔著重要責任。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。
舉報投訴
-
AI芯片
+關(guān)注
關(guān)注
17文章
1889瀏覽量
35064 -
AI算法
+關(guān)注
關(guān)注
0文章
251瀏覽量
12269
發(fā)布評論請先 登錄
相關(guān)推薦
【「從算法到電路—數(shù)字芯片算法的電路實現(xiàn)」閱讀體驗】+介紹基礎(chǔ)硬件算法模塊
結(jié)構(gòu)性的,而是算法性和原理性的,如WiFi芯片,里面充斥著各種復雜的矩陣運算、復數(shù)運算等,因為它們要解決的是多天線在無線道下的輸入、輸出問題。AI芯片、圖像/語音/視頻等多媒體處理
發(fā)表于 11-21 17:05
迅為瑞芯微RK3568核心板橋梁監(jiān)測設備接口應用
RK3568核心板以其豐富的接口擴展能力和高性能AI算力,支持橋梁全面監(jiān)測,提高監(jiān)測效率和準確性。同時,RK3568處理器在智能顯示、工業(yè)控制等領(lǐng)域有廣泛應用,適配系統(tǒng)新增雙麒麟系統(tǒng),增強產(chǎn)品競爭力
發(fā)表于 09-13 10:11
迅為RK3568核心板橋梁監(jiān)測設備接口應用
RK3568核心板以其豐富的接口擴展能力和高性能AI算力,支持橋梁全面監(jiān)測,提高監(jiān)測效率和準確性。同時,RK3568處理器在智能顯示、工業(yè)控制等領(lǐng)域有廣泛應用,適配系統(tǒng)新增雙麒麟系統(tǒng),增強產(chǎn)品競爭力
發(fā)表于 07-27 11:56
AI算法/模型/框架/模型庫的含義、區(qū)別與聯(lián)系
在人工智能(Artificial Intelligence,簡稱AI)的廣闊領(lǐng)域中,算法、模型、框架和模型庫是構(gòu)成其技術(shù)生態(tài)的重要基石。它們各自承擔著不同的角色,但又緊密相連,共同推動著AI
平衡創(chuàng)新與倫理:AI時代的隱私保護和算法公平
成了一把雙刃劍,其銳利的一面正逐漸指向我們的核心價值。面對這些挑戰(zhàn),制定一套有效的AI治理框架和隱私保護機制變得迫在眉睫。
確保AI決策的透明度是解決這些問題的關(guān)鍵一步。透明度不僅要求公開
發(fā)表于 07-16 15:07
ai大模型和ai框架的關(guān)系是什么
AI大模型和AI框架是人工智能領(lǐng)域中兩個重要的概念,它們之間的關(guān)系密切且復雜。 AI大模型的定義和特點 AI大模型是指具有大量參數(shù)的深度學習
AI大模型與AI框架的關(guān)系
多個領(lǐng)域取得顯著成果。而AI框架則是為開發(fā)和訓練AI模型提供的一套標準接口、特性庫和工具包,它集成了算法的封裝、數(shù)據(jù)的調(diào)用以及計算資源的使用,是AI
CubeIDE生成的代碼框架會卡在MX_X_CUBE_AI_Process()函數(shù)中是怎么回事?
當我將網(wǎng)絡模型部署到STM32F407VGT6中時,CubeIDE生成的代碼框架會卡在MX_X_CUBE_AI_Process()函數(shù)中是怎么回事?CUbeAI庫的版本是9.0。期待您的回復,謝謝
發(fā)表于 05-30 06:11
risc-v多核芯片在AI方面的應用
RISC-V多核芯片在AI方面的應用主要體現(xiàn)在其低功耗、低成本、靈活可擴展以及能夠更好地適應AI算法的不同需求等特點上。
首先,RISC-V適合用于高效設計實現(xiàn),其內(nèi)核面積更小,功耗更
發(fā)表于 04-28 09:20
開發(fā)者手機 AI - 目標識別 demo
Network Runtime 神經(jīng)網(wǎng)絡運行時,作為中間橋梁連通上層AI推理框架和底層加速芯片,實現(xiàn)AI模型的跨
發(fā)表于 04-11 16:14
ai芯片是什么東西 ai芯片和普通芯片的區(qū)別
AI芯片是專門為人工智能應用設計的處理器,它們能夠高效地執(zhí)行AI算法,特別是機器學習和深度學習任務。
數(shù)據(jù)語料庫、算法框架和算力芯片在AI大模型中的作用和影響
數(shù)據(jù)語料庫、算法框架和算力芯片的確是影響AI大模型發(fā)展的三大重要因素。
評論