97久久久综久久,jlzz大全高潮多水老师

前言

根據(jù)百度（Baidu）深度學(xué)習(xí)（deep learning）資深研究人員針對最新加速器進(jìn)行的測試結(jié)果顯示，現(xiàn)有的加速器芯片和軟件仍然存在一些美中不足之處，應(yīng)該盡快迎頭趕上。

這些結(jié)果有一部份來自于使用DeepBench測試。DeepBench是使用32位浮點數(shù)學(xué)訓(xùn)練神經(jīng)網(wǎng)絡(luò)的開放來源基準(zhǔn)。號稱“中國Google”的百度于2016年9月發(fā)布DeepBench，并在去年6月進(jìn)行了更新，使其涵蓋推論工作以及使用16位數(shù)學(xué)運算。

DeepBench利用神經(jīng)網(wǎng)絡(luò)庫測試不同硬件的基本運算效能（來源：Baidu）

百度硅谷人工智能實驗室（Silicon Valley AI Lab）資深研究員Greg Daimos解釋。在一些像矩陣乘法這樣的底層作業(yè)中，具有專用硬件的芯片（例如Nvidia Volta GPU的張量核心）能夠提供“數(shù)百TeraFlops （每秒1兆次浮點運算）。..比前一代的5-10TFLOPS更快幾個數(shù)量級?！?/p>

然而，他說：“在實際應(yīng)用中所使用的一些底層作業(yè)并沒有足夠的（數(shù)據(jù)）區(qū)域性，讓這些專用處理器充份發(fā)揮效能，所以我們必須為其適度地加速，或者改變算法。”

百度研究小組目前正探索兩種方式使用新芯片獲得更大回報。一方面，研究人員在其算法中開啟控制功能，以便同時接收饋入數(shù)據(jù)，期望能提高10倍的資料平行性。

另一條途徑是讓所有的模型看起來更像一般用于成像應(yīng)用的卷積神經(jīng)網(wǎng)絡(luò)（CNN）。Daimos說，CNN比一般用于文本或音頻應(yīng)用（app）等循序數(shù)據(jù)的遞歸神經(jīng)網(wǎng)絡(luò)（RNN）具有更多區(qū)域性。

研究人員在從文本產(chǎn)生音頻的百度模型中，“以CNN層取代RNN層堆?！?，使得“運算密度提高了40倍”，從而帶來了更好的新硬件利用率。他強調(diào)，“我們必須透過編寫的所有應(yīng)用程序來檢視是否可以普遍使用這種方法，或只是將其用于語音合成?！?/p>

目前尚不清楚這兩種方法的研究成果何時可用于生產(chǎn)系統(tǒng)。同時，Daimos也分享了硬件測試的其它觀察結(jié)果。

編程、內(nèi)存與靈活性

雖然百度取得將近90%的Nvidia Volta最佳利用率，但編程GPU并非易事。Diamos說，該芯片“有著成千上萬個線程，你必須在一個問題上進(jìn)行協(xié)調(diào)和同步。..。..編寫這樣的程序代碼并不容易，而當(dāng)面對的是像張量核心這樣的對象時就更困難了。”

的確，Diamos表示，“讓這些任務(wù)變得更易于編程，正是我們面臨的最大挑戰(zhàn)。....而其中最大的問題就出在內(nèi)存。我們想要執(zhí)行更大的神經(jīng)網(wǎng)絡(luò)，但內(nèi)存比預(yù)期地更快耗盡，這并不是透過打造更好的處理器就能解決的問題?！?/p>

他補充說，該問題的一部份答案在于尋找能與新興內(nèi)存搭配作業(yè)的技術(shù)，例如許多最新加速器所使用的高帶寬內(nèi)存（HBM）芯片堆棧等。

在百度的測試中，英特爾（Intel）多核心x86處理器Xeon Phi的利用率甚至高于Nvidia Volta。然而，英特爾的芯片還沒有任何張量專用核心，因此該芯片在神經(jīng)網(wǎng)絡(luò)作業(yè)上的性能不若Volta。

Nvidia Volta配備640個Tensor核心，每秒提供超過100TFLOPS的深度學(xué)習(xí)效能（來源：Nvidia）

直接進(jìn)行比較并不容易，因為不同的芯片通常使用不同的運算格式。例如，Xeon Phi采用定點數(shù)學(xué)，而Volta則混合使用16位和32位浮點運算。

Diamos說：“英特爾芯片的測試結(jié)果顯示，對于一些CNN來說，定點數(shù)學(xué)運算沒問題。然而Nvidia發(fā)布的結(jié)果顯示在影像和語音應(yīng)用上表現(xiàn)良好，所以我們?nèi)〉昧艘恍?shù)據(jù)，但還需要進(jìn)行更多研究?！?/p>

他稱贊AMD最新的GPU及其新的機器學(xué)習(xí)開放軟件是正確的發(fā)展方向，但指出他們也缺乏張量核心。他表示，對于英特爾Nirvana和Graphcore Colossus等芯片“沒啥可分享的消息”，也許是因為百度可能還在測試其預(yù)先發(fā)布的樣片。

擁有大量的矩陣乘法單元通常是一件好事。但是，Volta、Nervana和Colossus處理器則以充滿矩陣乘法數(shù)組的芯片將其性能指針推進(jìn)到或接近其工藝節(jié)點所能實現(xiàn)的極限。

他說：“最終你的收益會遞減。..。..讓你不得不放棄靈活度，以便為更多不同的工作負(fù)載進(jìn)行更精密的運算。因此，我們應(yīng)該找到曲線的轉(zhuǎn)折點，讓芯片不僅在CNN上運作良好，在其它方面也表現(xiàn)出色?！?/p>

神經(jīng)網(wǎng)絡(luò)軟件架構(gòu)各執(zhí)一端

除了底層數(shù)學(xué)之外，加速器還可能缺少優(yōu)化，因為它們并不完全了解深度學(xué)習(xí)應(yīng)用的所有范圍。

當(dāng)今用于設(shè)計神經(jīng)網(wǎng)絡(luò)的競爭軟件架構(gòu)各執(zhí)一端，可能會讓情況變得復(fù)雜。遺憾的是，跨不同架構(gòu)建立標(biāo)準(zhǔn)規(guī)格的努力也是各自為政，Diamos指出他的團(tuán)隊注意到目前有11種開發(fā)中規(guī)格分別處于不同的完善階段。

他說，由Facebook和微軟（Microsoft）發(fā)起的開放神經(jīng)網(wǎng)絡(luò)交換格式（ONNX）“正朝著正確的方向發(fā)展，但仍缺乏一些像是如何表達(dá)控制流程和反向傳播的特性?！?/p>

最近有20多家廠商（主要是半導(dǎo)體供應(yīng)商）宣布了神經(jīng)網(wǎng)絡(luò)交換格式（Neural Network Exchange Format），他們認(rèn)為該格式對芯片廠商來說更好。Diamos說：“要搞清這些格式中是否有些能成功實施可能還為時過早，但我們正踏上一條更好的發(fā)展道路，確實也需要其中某一種規(guī)格勝出?！?/p>

他補充說：“在2014年，我當(dāng)時認(rèn)為未來將會看到人工智能（AI）架構(gòu)的融合，就像如今在繪圖API中所看到的，但人們?nèi)匀辉诎l(fā)明新的神經(jīng)網(wǎng)絡(luò)類型，有時還會創(chuàng)造新的原型，所以它可能會像編程語言的多樣性一樣不斷地與時俱進(jìn)。”

也就是說，Daimos仍然看好深度學(xué)習(xí)。在今年稍早時，他的團(tuán)隊發(fā)表研究指出，這一領(lǐng)域尚未成熟，預(yù)計接下來將會看到更多的突破。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

人工智能

人工智能

+關(guān)注

關(guān)注
1792

文章
47430

瀏覽量
238972
人工智能芯片

人工智能芯片

+關(guān)注

關(guān)注
1

文章
120

瀏覽量
29126

原文標(biāo)題：巨頭們的人工智能芯片研發(fā)得怎么樣了？

文章出處：【微信號：eet-china，微信公眾號：電子工程專輯】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

蘋果或與博通攜手研發(fā)人工智能芯片

據(jù)消息人士透露，蘋果公司正在與博通公司攜手研發(fā)一款人工智能芯片，并計劃于2026年啟動生產(chǎn)。蘋果的高級機器學(xué)習(xí)和人工智能總監(jiān)Benoit Dupin最近表示，該公司正在考慮使用亞馬遜最

發(fā)表于 12-12 14:01 ?198次閱讀

嵌入式和人工智能究竟是什么關(guān)系?

領(lǐng)域，如工業(yè)控制、智能家居、醫(yī)療設(shè)備等。 人工智能是計算機科學(xué)的一個分支，它研究如何使計算機具備像人類一樣思考、學(xué)習(xí)、推理和決策的能力。人工智能的發(fā)展歷程可以追溯到上世紀(jì)50年代，經(jīng)

發(fā)表于 11-14 16:39

《AI for Science：人工智能驅(qū)動科學(xué)創(chuàng)新》第6章人AI與能源科學(xué)讀后感

探討了人工智能如何通過技術(shù)創(chuàng)新推動能源科學(xué)的進(jìn)步，為未來的可持續(xù)發(fā)展提供了強大的支持。首先，書中通過深入淺出的語言，介紹了人工智能在能源領(lǐng)域的基本概念和技術(shù)原理。這使得我對

發(fā)表于 10-14 09:27

AI for Science：人工智能驅(qū)動科學(xué)創(chuàng)新》第4章-AI與生命科學(xué)讀后感

研究的進(jìn)程。從蛋白質(zhì)結(jié)構(gòu)預(yù)測到基因測序與編輯，再到藥物研發(fā)，人工智能技術(shù)在生命科學(xué)的各個層面都發(fā)揮著重要作用。特別是像AlphaFold這樣的工具，成功解決了困擾生物學(xué)界半個多世紀(jì)的蛋白質(zhì)折疊問題，將

發(fā)表于 10-14 09:21

《AI for Science：人工智能驅(qū)動科學(xué)創(chuàng)新》第一章人工智能驅(qū)動的科學(xué)創(chuàng)新學(xué)習(xí)心得

的效率，還為科學(xué)研究提供了前所未有的洞察力和精確度。例如，在生物學(xué)領(lǐng)域，AI能夠幫助科學(xué)家快速識別基因序列中的關(guān)鍵變異，加速新藥研發(fā)進(jìn)程。 2. 跨學(xué)科融合的新范式書中強調(diào)，人工智能的應(yīng)用促進(jìn)了多個

發(fā)表于 10-14 09:12

risc-v在人工智能圖像處理應(yīng)用前景分析

和使用該技術(shù)，無需支付專利費或使用費。這大大降低了人工智能圖像處理技術(shù)的研發(fā)成本，并吸引了大量的開發(fā)者、企業(yè)和研究機構(gòu)參與其生態(tài)建設(shè)。靈活性則體現(xiàn)在RISC-V可以根據(jù)不同的應(yīng)用場景進(jìn)行定制和優(yōu)化，從而

發(fā)表于 09-28 11:00

名單公布！【書籍評測活動NO.44】AI for Science：人工智能驅(qū)動科學(xué)創(chuàng)新

材料基因組工程的推動下，人工智能如何與材料科學(xué)結(jié)合，加快傳統(tǒng)材料和新型材料的開發(fā)過程。第4章介紹了人工智能在加快藥物研發(fā)、輔助基因研究方面及在合成生物學(xué)中的普遍應(yīng)用。第5章介紹

發(fā)表于 09-09 13:54

人工智能如何改變著各行各樣

人工智能的風(fēng)起云涌，幾乎顛覆了千行百業(yè)創(chuàng)新的節(jié)奏，今天的人工智能就如同揮舞著“指揮棒”一樣，改變著各行各樣本來的“模樣”。

發(fā)表于 07-19 10:58 ?512次閱讀

東土科技自主研發(fā)的人工智能交通服務(wù)器實現(xiàn)規(guī)?；瘧?yīng)用

在智能交通領(lǐng)域，一場由東土科技引領(lǐng)的技術(shù)革新正悄然改變著城市交通的面貌。近日，東土科技自主研發(fā)的人工智能交通服務(wù)器在北京城市副中心通州區(qū)成功實現(xiàn)了580處交通路口的規(guī)?；瘧?yīng)用，標(biāo)志著我

發(fā)表于 07-17 15:42 ?458次閱讀

Python中的人工智能框架與實例

在人工智能（AI）領(lǐng)域，Python因其簡潔的語法、豐富的庫和強大的社區(qū)支持，成為了最受歡迎的編程語言之一。本文將詳細(xì)介紹Python中的人工智能框架，并通過具體實例展示如何使用這些框架來實現(xiàn)不同的人工智能應(yīng)用。

發(fā)表于 07-15 14:54 ?1754次閱讀

Google開發(fā)專為視頻生成配樂的人工智能技術(shù)

近日，科技巨頭Google旗下的人工智能研究實驗室DeepMind宣布了一項引人注目的技術(shù)突破——V2A技術(shù)（Video to Audio），這是一項專為視頻生成配樂的人工智能技術(shù)。這

發(fā)表于 06-20 11:03 ?520次閱讀

三星牽頭對人工智能芯片公司Tenstorrent進(jìn)行投資

近日，據(jù)外媒報道，科技巨頭三星牽頭對多倫多的人工智能芯片公司Tenstorrent進(jìn)行了一輪大規(guī)模的投資。據(jù)悉，此輪融資規(guī)模至少達(dá)到3億美元，進(jìn)一步鞏固了Tenstorrent在

發(fā)表于 06-17 18:22 ?791次閱讀

5G智能物聯(lián)網(wǎng)課程之Aidlux下人工智能開發(fā)（SC171開發(fā)套件V2）

人工智能 工業(yè)檢測：芯片模組外觀檢測實訓(xùn)part1 11分40秒 https://t.elecfans.com/v/25609.html *附件：芯片模組外觀檢測實訓(xùn).pdf 人工智能

發(fā)表于 05-10 16:46

5G智能物聯(lián)網(wǎng)課程之Aidlux下人工智能開發(fā)（SC171開發(fā)套件V1）

https://t.elecfans.com/v/27186.html *附件：引體向上測試案例_20240126.pdf 人工智能 工業(yè)檢測：芯片模組外觀檢測實訓(xùn)part1 11分40秒 https

發(fā)表于 04-01 10:40

嵌入式人工智能的就業(yè)方向有哪些?

。國內(nèi)外科技巨頭紛紛爭先入局，在微軟、谷歌、蘋果、臉書等積極布局人工智能的同時，國內(nèi)的BAT、華為、小米等科技公司也相繼切入到嵌入式人工智能的賽道。那么嵌入式AI可就業(yè)的方向有哪些呢？嵌入式AI開發(fā)

發(fā)表于 02-26 10:17

搜索歷史

巨頭們的人工智能芯片研發(fā)得怎么樣了

前言

評論