機(jī)器智能標(biāo)志著一個新的計(jì)算時代的開始,這個時代需要一種從根本上不同于以往的處理器和軟件工具。這個迅速增長的新市場為Graphcore創(chuàng)造了打造一家大型全球科技公司的機(jī)會。
眾所周知,使用AI算法的公司通常會選擇使用GPU,而機(jī)器學(xué)習(xí)算法需要快速處理海量數(shù)據(jù),這使得企業(yè)對硬件的需求日益攀升。
與傳統(tǒng)處理器不同,Graphcore所設(shè)計(jì)的這款芯片是專為機(jī)器學(xué)習(xí)系統(tǒng)打造,這種芯片可以部署于各種機(jī)器學(xué)習(xí)的應(yīng)用,例如聯(lián)網(wǎng)設(shè)備、自動駕駛、云計(jì)算以及機(jī)器人等領(lǐng)域,他們相信越來越多的企業(yè)將使用這些技術(shù)。
芯片產(chǎn)業(yè)鏈復(fù)雜,從技術(shù)研發(fā)、產(chǎn)品迭代及資金鏈需求角度而言,初創(chuàng)公司的成長挑戰(zhàn)都是巨大的。盡管如此,Graphcore還是迅速打開了行業(yè)知名度,原因之一離不開英國產(chǎn)業(yè)市場的特殊性。
在這樣的大環(huán)境下,Graphcore想要在AI硬件這個快速發(fā)展的行業(yè)中對標(biāo)巨頭英特爾和英偉達(dá),成長為一個英國本土大型上市企業(yè),并且不會出售給競爭對手。
根據(jù)IDC數(shù)據(jù)預(yù)測,認(rèn)知和人工智能系統(tǒng)在2017年全球收入將達(dá)到125億美元,并預(yù)計(jì)在2020年增長到460億美元。投資者之所以紛紛押注芯片制造商,也是因?yàn)檫@項(xiàng)技術(shù)是這一增長趨勢背后最為重要基礎(chǔ)支持。
Graphcore的誕生和目標(biāo)
與一般的新銳公司不同,Graphcore在人工智能學(xué)習(xí)的反應(yīng)速度以及低能耗方面,其開發(fā)的產(chǎn)品要比目前市場上所有的圖像處理解決方案好10到100倍。
Graphcore成立于2016年,其總部位于英國布里斯托,兩位聯(lián)合創(chuàng)始人Nigel Toon、Simons Knowles此前還共同創(chuàng)立過市值4.35億美金的3G蜂窩芯片公司Icera,后賣給英偉達(dá)。
Graphcore頻受資本和學(xué)界青睞,主要來自于其核心產(chǎn)品一款名為IPU的AI芯片,與常見的IPU(ImageProcessingUnit,圖像處理器)不同,其IPU主要應(yīng)用于無人駕駛汽車和云計(jì)算,專門為強(qiáng)大的機(jī)器習(xí)得系統(tǒng)設(shè)計(jì)。
此外還開發(fā)了一套可以幫助用戶無縫使用TensorFlow和MXNet等機(jī)器學(xué)習(xí)框架的接口,并為此提供了一個包含工具、驅(qū)動和應(yīng)用庫的開源軟件框架Poplar。
總的來說,Graphcore認(rèn)為先做Training然后做Inference的機(jī)制,未來一定會被Learning取代,即未來理想的人工智能應(yīng)該能夠在部署之后還能保持持續(xù)的學(xué)習(xí)和進(jìn)化。
市場看好融資多輪順暢
自創(chuàng)立以來,Graphcore就吸收了不少戰(zhàn)略投資方,其中A輪包括三星和博世,以及該輪融資中的寶馬和微軟。
在2017年初,Graphcore完成的3000萬美元融資就備受關(guān)注,因?yàn)檫@次投資方里包括了三星集團(tuán)、德國汽車巨頭Bosch以及Arm創(chuàng)始人HermannHauser,還吸引了DeepMind聯(lián)合創(chuàng)始人DemisHassabis、Uber首席科學(xué)家ZoubinGhahramani以及AtomicoandDellTechnologiesCapital的投資。
2017年10月,Graphcore接受了紅杉資本5千萬美元的投資,這是最近成為風(fēng)險投資新寵的AI芯片公司之一。
2018年12月,英國AI芯片公司Graphcore宣布完成新一輪2億美元融資,寶馬旗下風(fēng)投公司iVentures和微軟作為戰(zhàn)略投資方加入,公司估值達(dá)到17億美元。這樣一來,其融資總額超過3億美元。
本輪融資為Graphcore的D輪融資,在最近一個月里敲定,新晉投資人和早期投資人各占一半金額。由其早期投資人Skype創(chuàng)始人NiklasZennstrm‘sAtomico以及歐洲大型投資公司Sofina領(lǐng)投。寶馬iVentures和微軟、美利安全球投資者均是該輪融資的新晉投資方。
合理的推測是,博世和寶馬將為Graphcore推進(jìn)自動駕駛和車聯(lián)網(wǎng)市場提供便利,而三星則是手機(jī)和語音助手領(lǐng)域的窗口,戴爾還將為其提供云計(jì)算芯片市場的DOE和渠道資源。
此外,羅伯特博世風(fēng)險投資公司、C4風(fēng)險投資公司、戴爾科技資本、以色列最大風(fēng)投Pitango、三星和紅杉資本等跟投。
IPU的核心特征及難點(diǎn)
根據(jù)公開資料顯示,GraphcoreIPU的一些關(guān)鍵特征包括:
①同時支持Training和Inference。
②采用同構(gòu)多核(many-core)架構(gòu),超過1000個獨(dú)立的處理器。每個處理器核的處理能力和具體支持的操作還不清楚。支持all-to-all的核間通信,采用Bulk Synchronous Parallel的同步計(jì)算模型。
③采用大量片上memory,不直接連接DRAM,這可能是他們的架構(gòu)中最激進(jìn)的一個選擇。
Graphcore IPU的多功能性,即支持多種機(jī)器學(xué)習(xí)技術(shù)的高效表現(xiàn)適合各種應(yīng)用,無論是智能語音助手還是自動駕駛車輛。因?yàn)镚raphcoreIPU的靈活性,能夠在數(shù)據(jù)中心和車輛中使用相同的處理器,以減少用戶的開發(fā)時間和工作量。
此外,Graphcore IPU的規(guī)模很大,通常包括數(shù)千到數(shù)百萬個頂點(diǎn),這也意味著巨大的并行性。同時IPU是稀疏的,大多數(shù)頂點(diǎn)只連接到其他一小部分頂點(diǎn),即低精度。
對于新架構(gòu),幾乎Graphcore運(yùn)行神經(jīng)網(wǎng)絡(luò)模型的所有計(jì)算機(jī)系統(tǒng),甚至包括Google的特殊硬件,都使用RAM存儲。從RAM中獲取神經(jīng)網(wǎng)絡(luò)的權(quán)重需要耗費(fèi)大量的計(jì)算資源,所以處理器可以幫忙解決。
在Graphcore的芯片上,權(quán)重存儲在處理器中的高速緩存中,而不是存儲在RAM中,也不需要移動,因此,事情就變得比較簡單了。可能我們會得到一個系統(tǒng),比如一萬億個權(quán)重。
與微軟戴爾的緊密合作
11月18日至22日,Graphcore在美國丹佛舉辦的SC19上展示與微軟最新聯(lián)合發(fā)布的微軟Azure上GraphcoreIPU相關(guān)產(chǎn)品與介紹,并提供相關(guān)的注冊信息。
另外,使用了Graphcore第一個IPU技術(shù)的戴爾易安信DSS8440也將首次對外展示。
微軟和Graphcore的開發(fā)人員使用BERT語言模型實(shí)現(xiàn)了最先進(jìn)的性能和準(zhǔn)確性,僅用一個IPU服務(wù)器系統(tǒng)和8個C2IPU處理器PCIe卡就可以在56個小時內(nèi)訓(xùn)練BERTBase。通過BERT推理,吞吐量提高了3倍,延遲改善了20%以上,從而可以更快地交付結(jié)果。
微軟和Graphcore已經(jīng)緊密合作了兩年多。就在11月14日,Graphcore宣布了與微軟的具體合作內(nèi)容,并正式發(fā)布MicrosoftAzure上Graphcore智能處理單元(IPU)的預(yù)覽版。這是重大公有云供應(yīng)商首次提供Grapchore IPU,這些IPU從構(gòu)建之初便旨在支持下一代機(jī)器學(xué)習(xí)。
其強(qiáng)大的并行處理能力實(shí)現(xiàn)了快速訓(xùn)練模型并進(jìn)行超低延時運(yùn)行,這也使的Graphcore能夠在自然語言處理以及在理解自動駕駛視頻方面取得重大進(jìn)展。因此,IPU強(qiáng)大的并行處理能力是我們區(qū)別于其他處理器的一個重要因素。
Graphcore還將與戴爾公司一起展示第一個IPU技術(shù),該技術(shù)旨在滿足企業(yè)客戶構(gòu)建本地機(jī)器智能計(jì)算的需求。在戴爾公司的DellEMCDSS8440是一款采用Graphcore技術(shù)的機(jī)器學(xué)習(xí)服務(wù)器。
該系統(tǒng)使用8個GraphcoreC2IPU處理器PCIe卡提供1.6PetaFlops的機(jī)器智能計(jì)算,每個卡有2個IPU處理器,所有卡都在標(biāo)準(zhǔn)4U機(jī)箱中與高速IPU-Link技術(shù)連接。
這個全新的芯片速度會非常快,可以支撐很多不同的神經(jīng)系統(tǒng),擁有極高的擴(kuò)展性。Arm聯(lián)合創(chuàng)始人甚至把Graphcore IPU成為芯片產(chǎn)業(yè)的第三次革命。
結(jié)尾:
隨著人工智能對芯片算力和帶寬的需求越來越高,現(xiàn)在大多數(shù)的ASIC AI芯片并不能滿足當(dāng)下的需求。為此打造一個全新架構(gòu)的AI芯片就成為迫切需求,這也正是Graphcore IPU正在做的事情。
評論
查看更多