0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Jim Keller規(guī)劃AI策略,旨在繞過Nvidia

Astroys ? 來源:Astroys ? 2023-07-04 09:17 ? 次閱讀

在一個(gè)由Nvidia完全主導(dǎo)的AI市場中,要顛覆這個(gè)GPU巨頭對(duì)任何人來說都是極大的挑戰(zhàn),即便是傳奇的CPU架構(gòu)師也不例外。然而,Jim Keller的秘密武器并不是他的聲望,而是他堅(jiān)信開源策略能加速創(chuàng)新。

Jim Keller是一位傳奇的CPU架構(gòu)師,他的名字與一系列商業(yè)上成功的處理器緊密相連。在三十多年的職業(yè)生涯中,Keller在幾家組織中帶領(lǐng)團(tuán)隊(duì)或參與工作,開發(fā)了從Digital Equipment Corporation的Alpha,到AMD的K8、K12和Zen,再到Apple的A4、A5等AP,以及特斯拉的FSD芯片等各種架構(gòu)。

Keller是一位非常具有才華的工程師。然而,他是否能讓Tenstorrent(一家AI硬件初創(chuàng)公司,Keller從早期投資人晉升為今日的CEO)在不斷演變的AI競爭中勝出,仍有待觀察。

誰都無法打包票Tenstorrent一定會(huì)成功,其不確定的未來恰恰反映了AI技術(shù)和商業(yè)模式快速變化的狀態(tài)。

AI用戶(數(shù)據(jù)中心、云計(jì)算、消費(fèi)類電子和汽車)一直在制定自己的AI策略。一種新興趨勢是,許多人選擇通過購買AI或CPU的chiplet IP來構(gòu)建AI解決方案。大量購買新的AI處理器并不在他們的計(jì)劃中。

前不久,Keller在東京的RISC-V Day Tokyo活動(dòng)上發(fā)表了主題演講。

談到Tenstorrent計(jì)劃如何顛覆由Nvidia主導(dǎo)的AI市場。Keller直截了當(dāng)?shù)卣f:“我們并不試圖打敗Nvidia?!彼硎?,對(duì)于一家初創(chuàng)公司來說,挑戰(zhàn)年收入超過250億美元的巨人并不是一個(gè)好計(jì)劃。

然而,在AI世界中,AI模型的數(shù)學(xué)和操作規(guī)??偸窃诓粩嘧兓]有什么是永恒不變的。Keller找出了一些機(jī)會(huì),可能讓客戶選擇在Tenstorrent的芯片上對(duì)他們的AI模型進(jìn)行編程,而不是在Nvidia的GPU上。

Keller分享了兩個(gè)可能預(yù)示Tenstorrent生存的基本理念。一個(gè)是編程的“開源”。另一個(gè)是讓那些需要的人可以得到使用AI/CPU IP的授權(quán)。

開源API

今年夏天,Tenstorrent計(jì)劃為其AI硬件引入一個(gè)開源的硬件堆棧。Keller解釋說,BudaM是基于純C++并帶有API的Tenstorrent內(nèi)核,它允許直接寫入硬件。與CUDA相比,BudaM的優(yōu)勢在于,程序員可以完全控制Tenstorrent提供的每一個(gè)RISC-V內(nèi)核,包括RISC-V處理器、NoC(Network on Chip)、矩陣和向量引擎以及SRAM。

Keller說:“有很多客戶告訴我,他們用PyTorch編寫測試程序,但在低級(jí)別的CUDA中編寫實(shí)際模型?!彼私獾剿麄冋嬲胍氖恰耙环N在硬件上編程的方法”。

Keller說,例如,一些生物科學(xué)公司正在編寫大量迷你程序來分析數(shù)據(jù)。“對(duì)于這個(gè),他們希望能寫入硬件。”他補(bǔ)充說,一個(gè)AI編譯器公司也想使用BudaM。

5987d518-1a04-11ee-962d-dac502259ad0.jpg

Tesla的FSD芯片與Tenstorrent的AI芯片

在Tesla開發(fā)FSD芯片時(shí),Keller的任務(wù)是構(gòu)建一個(gè)非常高效的推理引擎。Keller說:“足夠好到能駕駛一輛汽車?!蓖ㄟ^設(shè)計(jì)一個(gè)雙AI引擎,他的團(tuán)隊(duì)“使FSD計(jì)算機(jī)有冗余,且足夠便宜,可以安裝在每輛車上”。

在那期間,Keller遇到了20到30家公司,包括向Tesla推銷他們的AI硬件的Tenstorrent。Keller將Tenstorrent視為“一個(gè)非常通用的AI處理器”,位于光譜的另一端。Keller預(yù)見到,當(dāng)未來出現(xiàn)不運(yùn)行在Tesla的FSD計(jì)算機(jī)上的AI模型時(shí),“我們會(huì)在Tesla使用Tenstorrent”。

路線圖

當(dāng)時(shí),Tenstorrent已經(jīng)擁有了比競爭對(duì)手更強(qiáng)大、更靈活、可編程性更強(qiáng)的AI硬件。這種架構(gòu)適用于推理和訓(xùn)練。Tenstorrent的AI硬件涵蓋了CNN、LLM和NLP。

為了實(shí)現(xiàn)其產(chǎn)品路線圖,Tenstorrent首先提出了一個(gè)簡單的、嵌入式的用于AI的RISC-V處理器。接著,它提出了一個(gè)集成了16個(gè)通用目的RISC-V內(nèi)核的標(biāo)準(zhǔn)ML計(jì)算機(jī)。Tenstorrent的信念是,AI需要RISC-V內(nèi)核和AI加速器,緊密地集成在同一塊芯片上。在路線圖的最遠(yuǎn)端,Tenstorrent的目標(biāo)是異構(gòu)高性能ML計(jì)算機(jī)。

59a2857a-1a04-11ee-962d-dac502259ad0.png

Chiplet授權(quán)

那款高度集成的異構(gòu)CPU/AI芯片仍在Tenstorrent的路線圖上。但Keller和他的團(tuán)隊(duì)已經(jīng)看到,潛在的客戶正在走向一條不同的道路。他們更喜歡更模塊化的AI解決方案,以滿足他們的需求。

有些人對(duì)Keller說,“忘掉AI。我們只想要CPU授權(quán)。”

還有一些人回到Keller那里說,“嘿,我們喜歡你的CPU。讓我們談?wù)凙I。但我們可以獲得授權(quán)嗎?”

Keller說,“這有點(diǎn)讓我們吃驚,因?yàn)槲以詾榈侥菚r(shí),市場上會(huì)有一些好的AI IP。”事實(shí)卻是沒有一個(gè)可以授權(quán)的。Keller的客戶已經(jīng)對(duì)Tenstorrent的AI引擎進(jìn)行了測試,“他們發(fā)現(xiàn)它相當(dāng)好,他們喜歡我們的編譯器?!?/p>

所以,就有了與LG達(dá)成的授權(quán)Tenstorrent chiplet的協(xié)議。

Keller說,“他們有一堆想法,他們想試試看。由于Tenstorrent能夠使用編譯器交付其硬件,LG在上面運(yùn)行了他們的模型,他們喜歡它。然后我們授權(quán)給他們IP?!眱杉夜镜穆?lián)合新聞發(fā)布稿稱,他們已經(jīng)合作,“打造新一代的RISC-V、AI和視頻編碼chiplet,可能為LG的高端電視和未來的汽車產(chǎn)品,以及Tenstorrent的數(shù)據(jù)中心產(chǎn)品提供動(dòng)力?!?/p>

Tenstorrent的chiplet授權(quán)交易并非僅限于LG。Keller說還有幾個(gè)也在pipeline中。

阻礙

盡管Tenstorrent在行業(yè)內(nèi)被認(rèn)為是一家AI芯片公司,但Keller正在將其定位為一家設(shè)計(jì)公司?!拔覀?cè)O(shè)計(jì)基于RISC-V的AI計(jì)算機(jī),我們?cè)O(shè)計(jì)RISC-V處理器。我們?cè)敢庖阅阆胍姆绞戒N售?!迸c潛在客戶的頻繁溝通促使Tenstorrent進(jìn)行了轉(zhuǎn)變。

Keller說,新的玩家急于利用開源、可授權(quán)的技術(shù)來推出他們自己的解決方案,他們認(rèn)為傳統(tǒng)的芯片公司阻礙了他們的道路。

凱勒親身體驗(yàn)過這一點(diǎn)。他說:“作為一名CPU架構(gòu)師,我想在CPU中添加適合AI的數(shù)據(jù)類型。但Intel或AMD當(dāng)然不會(huì)這樣做,因?yàn)樗麄儾粫?huì)向任何人授權(quán)?!眲P勒找到了Arm,他說,“他們靠授權(quán)處理器為生。但也說不行。”

“我認(rèn)識(shí)Arm那邊的人。我告訴他們這里有一些數(shù)據(jù)類型……如果你們能加入就太好了。我不會(huì)收費(fèi)?!?Arm仍然拒絕了。

于是,Keller轉(zhuǎn)向了RISC-V。他首先找到了SiFve,SiFve同意與Tenstorrent合作。不幸的是,SiFive并沒有與初創(chuàng)公司想要的兼容的路線圖。Keller說:“我認(rèn)為他們正在努力使之變得更好……但在那個(gè)時(shí)候,我告訴我的投資者,我可以雇傭世界上最好的CPU團(tuán)隊(duì),我們可以打造一個(gè)非常有競爭力的RISC-V處理器?!庇谑蔷陀辛薃scalon,Tenstorrent可授權(quán)的RISC-V處理器。

GPU效果出奇的好

在Keller看來,“GPU實(shí)際上效果出奇的好”,原因有兩個(gè)。一是Nvidia在軟件上投入了大量的資金。另一個(gè)是滲透效應(yīng)?!耙坏㎞vidia取得了領(lǐng)先,開發(fā)者傾向于構(gòu)建在GPU上運(yùn)行的模型。他們不會(huì)構(gòu)建一些在例如Tenstorrent硬件上可能會(huì)運(yùn)行更好的模型,因?yàn)橛布c他們所熟悉的不同。”

話雖如此,Keller說,有一些人“真正想要的東西與Nvidia提供的不同”。

在某種程度上,GPU的評(píng)價(jià)并不高,Keller說:“因?yàn)樗浅0嘿F,且功耗很高。編程GPU需要大量的程序員。成千上萬的程序員正在用CUDA編寫庫。”

Keller解釋說,當(dāng)AI程序員在CUDA中編寫代碼并且出現(xiàn)問題時(shí),他們會(huì)要求Nvidia進(jìn)行編譯并返回一個(gè)可運(yùn)行的二進(jìn)制文件。這種關(guān)系(AI程序員和Nvidia之間的關(guān)系)形成了一個(gè)反饋循環(huán)。

但是這個(gè)循環(huán)并不能保證AI程序員能立即從Nvidia那里得到解決方案。

Keller說,“我在Tesla時(shí)使用過Nvidia的AI計(jì)算機(jī)。當(dāng)出現(xiàn)問題時(shí),我們無法弄清楚問題所在?!被蛘?,“當(dāng)它崩潰時(shí),我們最后發(fā)現(xiàn)了Nvidia的一個(gè)bug。我們告訴他們,但有時(shí)從他們那里得到反饋需要幾周時(shí)間?!?/p>

這就是為什么Keller在推動(dòng)開源?!叭绻浖情_源的,即使它出現(xiàn)問題,專家級(jí)的軟件人員可以進(jìn)去閱讀代碼并找出問題所在。”

他總結(jié)說:“當(dāng)多人紛紛進(jìn)行改變時(shí),會(huì)發(fā)生令人振奮的事。當(dāng)它是開源的,他們就必須發(fā)布它。本質(zhì)上,這加速了創(chuàng)新?!?/p>

Tenstorrent不太可能在短時(shí)間內(nèi)在AI市場上取代Nvidia。然而,Keller的重點(diǎn)是去滿足那些從Nvidia那里無法得到真正所需的客戶。Tenstorrent有可能扭轉(zhuǎn)乾坤或趕超Nvidia的關(guān)鍵是,開源技術(shù)的發(fā)展趨勢,以及客戶對(duì)通過chiplet進(jìn)行AI和CPU IP授權(quán)的無盡需求。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    19286

    瀏覽量

    229853
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    30896

    瀏覽量

    269108
  • C++
    C++
    +關(guān)注

    關(guān)注

    22

    文章

    2108

    瀏覽量

    73651
  • RISC-V
    +關(guān)注

    關(guān)注

    45

    文章

    2277

    瀏覽量

    46159

原文標(biāo)題:Jim Keller規(guī)劃AI策略,旨在繞過Nvidia

文章出處:【微信號(hào):Astroys,微信公眾號(hào):Astroys】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    NVIDIA助力企業(yè)創(chuàng)建定制AI應(yīng)用

    NVIDIA 近日宣布與眾多技術(shù)領(lǐng)導(dǎo)者一同使用最新NVIDIA NIM Agent Blueprint以及NVIDIA NeMo和NVIDIA NIM微服務(wù),幫助企業(yè)創(chuàng)建定制
    的頭像 發(fā)表于 11-20 09:12 ?343次閱讀

    NVIDIA助力Amdocs打造生成式AI智能體

    正在使用NVIDIA DGX Cloud 與 NVIDIA AI Enterprise軟件開發(fā)和交付基于商用大語言模型(LLM)和領(lǐng)域適配模型的解決方案。該公司還在使用NVIDIA
    的頭像 發(fā)表于 11-19 14:48 ?346次閱讀

    日本企業(yè)借助NVIDIA產(chǎn)品加速AI創(chuàng)新

    日本領(lǐng)先企業(yè)和大學(xué)正在使用 NVIDIA NeMo、NIM 微服務(wù)和 NVIDIA Isaac 加速 AI 創(chuàng)新。
    的頭像 發(fā)表于 11-19 14:34 ?304次閱讀

    金融科技公司利用NVIDIA技術(shù)加強(qiáng)金融服務(wù)應(yīng)用

    通過 NVIDIA NIM 微服務(wù)和加速計(jì)算,Ntropy、Contextual AI、NayaOne 和 Securiti 增強(qiáng)了用于欺詐檢測、財(cái)務(wù)規(guī)劃等領(lǐng)域的 AI 應(yīng)用。
    的頭像 發(fā)表于 10-31 15:20 ?888次閱讀

    NVIDIA生成式AI進(jìn)入ROS社區(qū)

    NVIDIA 在 ROSCon 上發(fā)布更新,旨在加速 AI 驅(qū)動(dòng)的機(jī)械臂和自主移動(dòng)機(jī)器人的開發(fā)。
    的頭像 發(fā)表于 10-31 14:41 ?271次閱讀

    HOMEE AI利用NVIDIA Omniverse開發(fā)出“AI即服務(wù)”空間規(guī)劃解決方案

    HOMEE AINVIDIA 初創(chuàng)加速計(jì)劃成員。該公司開發(fā)了一種“AI 即服務(wù)”空間規(guī)劃解決方案,旨在為價(jià)值 6500 億美元的全球家
    的頭像 發(fā)表于 09-09 10:00 ?470次閱讀
    HOMEE <b class='flag-5'>AI</b>利用<b class='flag-5'>NVIDIA</b> Omniverse開發(fā)出“<b class='flag-5'>AI</b>即服務(wù)”空間<b class='flag-5'>規(guī)劃</b>解決方案

    NVIDIA RTX AI套件簡化AI驅(qū)動(dòng)的應(yīng)用開發(fā)

    NVIDIA 于近日發(fā)布 NVIDIA RTX AI套件,這一工具和 SDK 集合能夠幫助 Windows 應(yīng)用開發(fā)者定制、優(yōu)化和部署適用于 Windows 應(yīng)用的 AI 模型。該套件
    的頭像 發(fā)表于 09-06 14:45 ?452次閱讀

    全新NVIDIA NIM微服務(wù)將生成式AI引入數(shù)字環(huán)境

    生成式物理 AI NIM 微服務(wù)以及 NVIDIA Metropolis 參考工作流旨在協(xié)助創(chuàng)建智能的沉浸式工作環(huán)境。
    的頭像 發(fā)表于 08-02 15:20 ?549次閱讀

    英偉達(dá)推出全新NVIDIA AI Foundry服務(wù)和NVIDIA NIM推理微服務(wù)

    NVIDIA 宣布推出全新 NVIDIA AI Foundry 服務(wù)和 NVIDIA NIM 推理微服務(wù),與同樣剛推出的 Llama 3.1 系列開源模型一起,為全球企業(yè)的生成式
    的頭像 發(fā)表于 07-25 09:48 ?709次閱讀

    HPE 攜手 NVIDIA 推出 NVIDIA AI Computing by HPE,加速生成式 AI 變革

    同發(fā)布“NVIDIA AI Computing by HPE”。 作為極具開創(chuàng)性的一站式“交鑰匙”私有云人工智能(private-cloud AI)解決方案,NVIDIA
    的頭像 發(fā)表于 06-21 14:39 ?370次閱讀

    NVIDIA推出NVIDIA AI Computing by HPE加速生成式 AI 變革

    作為極具開創(chuàng)性的一站式“交鑰匙”私有云人工智能(private-cloud AI)解決方案,NVIDIA AI Computing by HPE 包含了可持續(xù)的加速計(jì)算產(chǎn)品組合以及全生命周期服務(wù),將
    的頭像 發(fā)表于 06-20 17:36 ?728次閱讀

    NVIDIA AI Enterprise榮獲金獎(jiǎng)

    NVIDIA AI Enterprise、GH200 Grace Hopper 超級(jí)芯片和 Spectrum-X 在 COMPUTEX 2024 獲得認(rèn)可。
    的頭像 發(fā)表于 05-29 09:27 ?452次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>AI</b> Enterprise榮獲金獎(jiǎng)

    香港應(yīng)科院與蘇州國芯聯(lián)合組建新型AI芯片實(shí)驗(yàn)室,推動(dòng)AI芯片行業(yè)發(fā)展

    AI時(shí)代,RISC-V架構(gòu)正面臨新的發(fā)展機(jī)遇。據(jù)硅谷芯片專家Jim Keller所言,“RISC-V的潛力巨大,未來AI軟件應(yīng)用將呈現(xiàn)前所未有的局面,而RISC-V有望成為下一代
    的頭像 發(fā)表于 05-22 15:55 ?792次閱讀

    Jim KellerNVIDIA私有協(xié)議弊端多,倡導(dǎo)開放技術(shù)以省數(shù)十億

    另外,他進(jìn)一步闡述,NVIDIA在數(shù)據(jù)中心的網(wǎng)絡(luò)架構(gòu)設(shè)計(jì)上不應(yīng)固守其自主研發(fā)的InfiniBand技術(shù),而應(yīng)轉(zhuǎn)向以太網(wǎng)。盡管Infiniband網(wǎng)絡(luò)具有低延遲和高帶寬優(yōu)勢,但以太網(wǎng)已實(shí)現(xiàn)400GbE甚至800GbE的傳輸速率。
    的頭像 發(fā)表于 04-15 09:43 ?423次閱讀

    日本為何押注于Jim Keller?

    日本要想確保芯片供應(yīng)并鞏固國防,就必須建設(shè)尖端的半導(dǎo)體工廠和AI技術(shù)。日本將領(lǐng)導(dǎo)國家AI/RISC-V/芯片項(xiàng)目的任務(wù)交給了加拿大初創(chuàng)公司Tenstorrent。
    的頭像 發(fā)表于 03-06 09:18 ?719次閱讀
    日本為何押注于<b class='flag-5'>Jim</b> <b class='flag-5'>Keller</b>?