當(dāng)谷歌宣布其第二代專用集成電路來(lái)加速公司的機(jī)器學(xué)習(xí)處理時(shí),筆者的電話開(kāi)始響個(gè)不停,問(wèn)這對(duì)半導(dǎo)體行業(yè)的潛在影響。世界上最大的數(shù)據(jù)中心“Super7”的其它成員是否都急于為AI制造自己的芯片?這對(duì)AI芯片和平臺(tái)的領(lǐng)先供應(yīng)商N(yùn)VIDIA、AMD、Intel等其它公司以及許多希望進(jìn)入這個(gè)利潤(rùn)豐厚市場(chǎng)的初創(chuàng)公司有何影響?當(dāng)GPU和FPGA開(kāi)始看起來(lái)如此有前途的時(shí)候,它們的游戲結(jié)束了嗎?為了回答這些問(wèn)題,讓我們進(jìn)入這些互聯(lián)網(wǎng)巨頭的頭腦,看看他們可能在計(jì)劃什么。
AI的硅景觀
正如筆者在今年早些時(shí)候的一篇文章中所探討的,有四種主要類型的技術(shù)可用于加速深度神經(jīng)網(wǎng)絡(luò)的訓(xùn)練和使用:CPU、GPU、FPGA和ASIC。老式備用CPU具有無(wú)限可編程的優(yōu)勢(shì),性能不錯(cuò),但不是很出色。它主要用于推理工作負(fù)載,其中訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)引導(dǎo)計(jì)算對(duì)輸入數(shù)據(jù)項(xiàng)做出準(zhǔn)確的預(yù)測(cè)。另一方面,Intel和Xilinx的FPGA在極低功耗下提供出色的性能,但也提供了更大的靈活性,允許設(shè)計(jì)人員更改底層硬件以最好地支持不斷變化的軟件。FPGA主要用于機(jī)器學(xué)習(xí)推理,視頻算法和成千上萬(wàn)的小批量專用應(yīng)用。然而,編程FPGA硬件所需的技能很難獲得,并且FPGA的性能在某些工作負(fù)載下無(wú)法接近高端GPU的性能。
如今,機(jī)器學(xué)習(xí)、訓(xùn)練和推理、云和邊緣都使用了許多類型的硬件加速器。從技術(shù)上講,GPU是一種用于處理圖形算法的ASIC。不同之處在于,ASIC提供指令集和庫(kù),允許對(duì)GPU進(jìn)行編程,以對(duì)本地存儲(chǔ)的數(shù)據(jù)進(jìn)行操作,作為許多并行算法的加速器。GPU擅長(zhǎng)執(zhí)行矩陣運(yùn)算(主要是矩陣乘法),這是圖形、AI和許多科學(xué)算法的基礎(chǔ)?;旧希珿PU是非??焖俸拖鄬?duì)靈活的。
另一種選擇是設(shè)計(jì)一個(gè)專用于執(zhí)行固定操作的定制ASIC,因?yàn)檎麄€(gè)芯片的邏輯區(qū)域可以專用于一組特定功能。在谷歌TPU的情況下,它們可以很好地實(shí)現(xiàn)高度并行,而處理神經(jīng)網(wǎng)絡(luò)是一種“令人尷尬的并行”工作負(fù)載。把ASIC想象成一輛飆車;它可以跑得很快,但它只能載一個(gè)人直線行駛四分之一英里。你不能開(kāi)著它繞著街區(qū)轉(zhuǎn),也不能開(kāi)著它在橢圓形跑道上跑。
這里有一個(gè)問(wèn)題:設(shè)計(jì)ASIC可能是一項(xiàng)昂貴的工作,耗資數(shù)千萬(wàn)甚至數(shù)億美元,需要一個(gè)相當(dāng)昂貴的工程師團(tuán)隊(duì)。支付所有這些開(kāi)發(fā)費(fèi)用意味著需要成千上萬(wàn)的芯片在設(shè)計(jì)的使用壽命(通常是2-3年)內(nèi)攤銷這些費(fèi)用。此外,芯片需要經(jīng)常更新,以跟上新技術(shù)和制造工藝的步伐。最后,由于設(shè)計(jì)師在開(kāi)發(fā)過(guò)程的早期就凍結(jié)了邏輯,當(dāng)新想法出現(xiàn)在快速發(fā)展的領(lǐng)域(如AI)時(shí),他們將無(wú)法快速做出反應(yīng)。另一方面,F(xiàn)PGA(在一定程度上甚至是GPU)可以重新編程以實(shí)現(xiàn)新功能。
谷歌為什么要制造TPU?
如果仔細(xì)想想谷歌的業(yè)務(wù),就會(huì)發(fā)現(xiàn)它有三個(gè)特點(diǎn),很可能促使它投資于AI定制芯片。檢查這些因素可能有助于評(píng)估其它公司進(jìn)行類似投資的潛在可能性。
戰(zhàn)略意圖
谷歌曾多次表示要成為一家“AI First”的公司。換句話說(shuō),AI技術(shù)在整個(gè)業(yè)務(wù)中發(fā)揮著戰(zhàn)略作用:搜索、自動(dòng)駕駛汽車、谷歌云、谷歌家庭,以及許多其它新的和現(xiàn)有的產(chǎn)品及服務(wù)。因此,谷歌想要控制自己的硬件(TPU)加速器和自己的軟件框架(TensorFlow)是有道理的,他們將在這些框架上構(gòu)建自己的產(chǎn)品和服務(wù)。該公司愿意投資,以使自己比其它擁有類似抱負(fù)的公司更有優(yōu)勢(shì)。
所需規(guī)模
谷歌的計(jì)算基礎(chǔ)設(shè)施是世界上最大的,這種規(guī)模意味著它可能擁有所需的容量,以證明開(kāi)發(fā)和維護(hù)自己的AI加速硬件平臺(tái)的巨大成本是合理的。事實(shí)上,谷歌聲稱TPU使公司不必再建造12個(gè)數(shù)據(jù)中心來(lái)處理AI負(fù)載。
讓我們做一些敏感性分析,以了解單個(gè)ASIC周期所需的可能規(guī)模。為了便于討論,假設(shè)谷歌花費(fèi)了1億美元,包括掩模生產(chǎn),每個(gè)芯片將為他們節(jié)省大約1K美元。作為參考,一個(gè)45 TFLOPS的單個(gè)Cloud TPU芯片可能比NVIDIA Volta GPU在峰值120 TFLOPS時(shí)的性能略高1/3,所以需要3個(gè)TPU芯片來(lái)取代一個(gè)高端GPU。這意味著谷歌部署100K的TPU,大概可以實(shí)現(xiàn)收支平衡(不考慮資金的時(shí)間價(jià)值)。
這對(duì)大多數(shù)公司來(lái)說(shuō)都是很大的籌碼,即使對(duì)谷歌來(lái)說(shuō)也是如此。另一方面,如果開(kāi)發(fā)芯片和TPU板只需要6000萬(wàn)美元,每個(gè)芯片節(jié)省2K美元,那么他們只需要30K芯片就可以實(shí)現(xiàn)收支平衡。因此,大型數(shù)據(jù)中心可能需要30-100K的芯片,才能在2-3年的時(shí)間內(nèi)實(shí)現(xiàn)收支平衡。
谷歌云計(jì)算的重要性
谷歌的高管們不能滿足于在全球云計(jì)算市場(chǎng)上落后于亞馬遜和微軟。在Diane Greene的領(lǐng)導(dǎo)下,他們?cè)诠雀柙粕贤度肓舜罅抠Y金,現(xiàn)在正在享受行業(yè)中最快的增長(zhǎng)。谷歌可以利用谷歌云TPU的定價(jià)權(quán)和性能,以及TensorFlow的普及,在云計(jì)算機(jī)器學(xué)習(xí)發(fā)展中占據(jù)市場(chǎng)份額時(shí)發(fā)揮潛在顯著優(yōu)勢(shì)。然而,谷歌表示,使用他們的云TPU的價(jià)格將與高端GPU的云訪問(wèn)價(jià)格相當(dāng)。谷歌并不打算直接出售TPU。
還有誰(shuí)像谷歌?
坦率地說(shuō),雖然所有其它Super 7成員(亞馬遜、阿里巴巴、百度、Facebook、微軟和騰訊)都有能力建立自己的加速器,但沒(méi)有人能像百度那樣在這三個(gè)方面都表現(xiàn)得如此出色。此外,在實(shí)際接近的公司中,有幾家似乎正在朝著不同的方向發(fā)展:
百度最近公開(kāi)表示,它正在與英偉達(dá)合作,在云、家庭和汽車領(lǐng)域開(kāi)展AI計(jì)劃。這并不意味著百度有朝一日不能也不會(huì)制造自己的芯片,但就目前而言,該公司似乎滿足于專注于自己的軟件和服務(wù)。此外,百度的云業(yè)務(wù)仍然是其業(yè)務(wù)中相對(duì)較小的一部分。
微軟是第二大云服務(wù)提供商,擁有大量(5000名)穩(wěn)定的AI工程師,并致力于通過(guò)其面向企業(yè)客戶的工具和API使AI“民主化”。然而,該公司已經(jīng)決定(至少目前)在Azure和Bing基礎(chǔ)設(shè)施中使用英特爾的Altera FPGA,相信在快速變化的世界中,它可以從更靈活的硬件平臺(tái)中受益。此外,微軟使用NVIDIA的GPU來(lái)訓(xùn)練其神經(jīng)網(wǎng)絡(luò)。
亞馬遜可能是最接近上述谷歌模式的。AWS規(guī)模龐大,該公司正在大力投資AI。雖然亞馬遜可能傾向于使用Apache MXNet框架進(jìn)行AI開(kāi)發(fā),但它的AWSAI云服務(wù)支持所有主要框架,使其成為AI開(kāi)發(fā)領(lǐng)域的開(kāi)放軟件。此外,以英偉達(dá)為基礎(chǔ)的Ying和以TPU為中心的Yang可能是一個(gè)有效的策略。亞馬遜以前也走過(guò)ASIC的道路;為了削減AWS基礎(chǔ)設(shè)施的成本和延遲,它在2012年收購(gòu)了Ana Purna Labs。目前,該公司已經(jīng)在以色列有了一個(gè)芯片團(tuán)隊(duì)。最后,像百度一樣,亞馬遜似乎熱衷于使用FPGA,因?yàn)樗鼈兙哂锌删幊痰奶匦浴?/p>
結(jié)論
筆者并不是在預(yù)測(cè)其它的Super 7公司都不會(huì)跳出GPU這條船,跳上自己的ASIC,但在筆者看來(lái),很多公司都不太可能這么做——至少不會(huì)很快。
他們似乎都在用大量的數(shù)據(jù)開(kāi)發(fā)機(jī)器學(xué)習(xí)模型,并忙于將這些模型應(yīng)用于各種產(chǎn)品和服務(wù)中。構(gòu)建ASIC和支持它的軟件是一個(gè)持續(xù)且昂貴的提議,可能會(huì)分散注意力。或者,將用于訓(xùn)練的GPU的性能與用于推理的FPGA的靈活性和效率相結(jié)合,也有很大的希望。所以筆者個(gè)人并不認(rèn)為GPU的天要塌下來(lái)了,至少在不久的將來(lái)不會(huì)。AMD當(dāng)然相信對(duì)GPU有很大的需求,并將他們的Vega技術(shù)瞄準(zhǔn)了這一點(diǎn)。
原文鏈接:
https://moorinsightsstrategy.com/will-asic-chips-become-the-next-big-thing-in-ai/
-
asic
+關(guān)注
關(guān)注
34文章
1204瀏覽量
120542 -
AI
+關(guān)注
關(guān)注
87文章
31022瀏覽量
269360
原文標(biāo)題:ASIC芯片會(huì)成為AI的下一件大事嗎?
文章出處:【微信號(hào):SSDFans,微信公眾號(hào):SSDFans】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論