0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI輔助制芯技術(shù),將計算光刻提速40倍

傳感器技術(shù) ? 來源:EDA365電子論壇 ? 2023-03-24 13:44 ? 次閱讀

前言

北京時間3月21日晚11點,一年一度的英偉達GPU技術(shù)大會GTC(Gpu Technology Conference)如期而至,吸引了超過25萬名觀眾參與。

黃仁勛教主一如既往地穿著標志性的黑皮夾,進行了長達78分鐘的主題演講,逐一向觀眾披露了英偉達的最新產(chǎn)品——挑戰(zhàn)芯片極限的計算光刻技術(shù)、ChatGPT專用GPU等,無一不是“核彈”級別的殺手锏。

黃仁勛表示,近40年以來,摩爾定律一直是引領(lǐng)計算機行業(yè)發(fā)展的重要規(guī)律,但在成本與功耗不變的情況下,這一定律已經(jīng)逐漸放緩,各行各業(yè)都在尋找數(shù)字化轉(zhuǎn)型,而英偉達要用技術(shù)重塑行業(yè),“要成為顛覆者,而不是被顛覆者。要利用加速計算和AI,幫助企業(yè)應(yīng)對這些挑戰(zhàn)。”

野心勃勃的英偉達,不斷用芯片推動AI技術(shù),也正在用AI技術(shù)賦能芯片行業(yè)。

01

AI輔助制芯技術(shù),將計算光刻提速40倍

此次大會中,黃仁勛宣布了一項為芯片領(lǐng)域帶來的重大突破——推出計算光刻軟件庫cuLitho,將加速計算帶入計算光刻領(lǐng)域,使計算速度提升40倍。

黃仁勛稱,英偉達經(jīng)過與臺積電、ASML、Synopsys(新思科技)三大半導體巨頭的多年合作,終于推出了這一技術(shù),大大降低芯片代工廠在這一工序上所消耗的時間和能耗,為2nm以及更先進制程的到來做好準備。

我們知道,光刻是芯片制造過程中的一個重要工藝,相當于用“光刀”在晶圓上“雕刻”出精細的電路圖。這個圖案首先要呈現(xiàn)在光掩膜(photomask)上。掩膜板就像是漏字板,激光一照,通過鏡頭,“漏字板”上的圖案也就落到了硅片上,如下圖:

f3d7ffe6-c9fd-11ed-bfe3-dac502259ad0.gif

晶體管、器件、互聯(lián)線路都需要經(jīng)過這樣的光刻步驟。***巨頭ASML也是靠著這一技術(shù)一直壟斷著全球的EUV***。

ASML曾表示,計算光刻是其“鐵三角”業(yè)務(wù)之一。計算光刻技術(shù)是通過模擬光通過光學元件并與光刻膠相互作用時的行為,應(yīng)用逆物理算法來預(yù)測掩膜板上的圖案,以便在晶圓上生成最終圖案。

換言之,就是計算光刻是通過軟件,對整個光刻過程來做建模和仿真,對工藝流程做優(yōu)化,比如說形貌優(yōu)化、掩膜板修正等。計算光刻目的是消除光刻過程中,小尺寸器件“模糊”的問題。

在芯片設(shè)計和制造領(lǐng)域中,計算光刻是最大的計算工作負載,每年都要消耗數(shù)百億CPU小時。

隨著晶體管和互聯(lián)線寬的持續(xù)微縮,掩膜板的復(fù)雜度可能會越來越高。英偉達先進技術(shù)副總裁Vivek Singh說,foundry廠所需的數(shù)據(jù)中心規(guī)模擴張速度,會比摩爾定律本身的發(fā)展速度還要快;最終就是沒有足夠多的算力來解決問題。

“按照過去15年的趨勢,如果某個foundry廠現(xiàn)有3座數(shù)據(jù)中心,那么未來10年內(nèi)就需要100座這樣的數(shù)據(jù)中心?!盫ivek說道,“功耗方面,45兆瓦(MegaWatt)或許還行,但如果是45千兆瓦(GigaWatt),問題就比較大了。英偉達對此給出的回答是cuLitho?!?/p>

英偉達的新算法cuLitho,可以讓日益復(fù)雜的計算光刻工作流程能夠在GPU上并行執(zhí)行,它不僅能使計算速度提升40倍,而且功耗也可以降低9倍之多。

f3fb4f14-c9fd-11ed-bfe3-dac502259ad0.jpg

舉個例子,比如英偉達的H100在制造過程中需要89塊掩膜板。如果用CPU進行處理的話,每個掩膜板都需要消耗兩周的時間。

而如果在GPU上運行cuLitho,則只需8個小時即可處理完一個掩膜板。

而臺積電也可以用500個DGX H100系統(tǒng)中的4,000個Hopper GPU,完成之前需要多達40,000臺基于CPU的服務(wù)器才能搞定的工作,并且功率也會從35MW降至5MW。

英偉達拋出的這一技術(shù),無疑相當于一枚芯片界的“核彈”,它使得2nm及更先進芯片的生產(chǎn)成為可能。未來,臺積電、ASML、Synopsys也將引入這一技術(shù),繼續(xù)突破芯片制造的物理極限。臺積電方面消息稱,將于今年6月對cuLitho進行生產(chǎn)資格認證,加速2nm芯片試產(chǎn)。

02

ChatGPT專用GPU:H100 NVL——提速10倍

黃仁勛一直對AI和機器學習持倡導態(tài),他曾公開表示AI技術(shù)已經(jīng)來到拐點,押注AI十年也使得英偉達在ChatGPT浪潮中獲得豐厚回報。對于大型語言模型而言,算力是其中最重要一環(huán),因此高度依賴英偉達強大的GPU芯片。

針對算力需求巨大的 ChatGPT,英偉達發(fā)布了 NVIDIA H100 NVL,這是一種具有 94GB 內(nèi)存和加速 Transformer Engine 的大語言模型(LLM)專用解決方案,配備了雙 GPU NVLINK 的 PCIE H100 GPU。

黃仁勛的主題演講中披露了該公司推出的全新GPU推理平臺,該平臺包括4種不同配置,針對不同工作負載進行優(yōu)化,分別對應(yīng)了AI視頻加速、圖像生成加速、大型語言模型(LLM)加速和推薦系統(tǒng)和LLM數(shù)據(jù)庫。包括:L4 Tensor Core GPU、L40 GPU、H100 NVL GPU和Grace Hopper超級芯片。

其中最主要的是H100 NVL,它將英偉達的兩個H100 GPU拼接在一起,以部署像ChatGPT這樣的大型語言模型(LLM)。黃仁勛表示,“當前唯一可以實際處理ChatGPT的GPU是英偉達HGX A100。與前者相比,現(xiàn)在一臺搭載四對H100和雙NVLINK的標準服務(wù)器速度能快10倍,可以將大語言模型的處理成本降低一個數(shù)量級?!?/p>

據(jù)悉,H100 NVL附帶94GB內(nèi)存,與上一代產(chǎn)品相比,H100的綜合技術(shù)創(chuàng)新可以將大型語言模型的速度提高30倍。據(jù)黃仁勛透露,H100 NVL預(yù)計將在今年下半年上市。

此外,用于AI Video的L4芯片,在視頻解碼和轉(zhuǎn)碼、視頻內(nèi)容審核、視頻通話功能上做了優(yōu)化。英偉達稱其可以提供比CPU高120倍的AI視頻性能,同時能效提高99%。

同時,英偉達還針對Omniverse、圖形渲染以及文本轉(zhuǎn)圖像/視頻等生成式AI推出了L40芯片。其性能是英偉達最受歡迎的云推理GPU T4的10倍。

英偉達推出的全新超級芯片Grace-Hopper,適用于推薦系統(tǒng)和大型語言模型的AI數(shù)據(jù)庫,圖推薦模型、向量數(shù)據(jù)庫和圖神經(jīng)網(wǎng)絡(luò)的理想選擇,通過900GB/s的高速一致性芯片到芯片接口連接英偉達Grace CPU和Hopper GPU。

03

全球首個GPU加速量子計算系統(tǒng)

在21日的活動中,英偉達還官宣了一個使用 Quantum Machines 構(gòu)建的新系統(tǒng),該系統(tǒng)為從事高性能和低延遲量子經(jīng)典計算的研究人員提供了一種革命性的新架構(gòu)。

據(jù)黃仁勛介紹,NVIDIA DGX Quantum是全球首個GPU加速的量子計算系統(tǒng),可以實現(xiàn)GPU和量子處理單元(QPU)之間的亞微秒級延遲。其將全球最強大的加速計算平臺(由 NVIDIA Grace Hopper 超級芯片和 CUDA Quantum 開源編程模型實現(xiàn))與全球最先進的量子控制平臺 OPX(由 Quantum Machines 提供)相結(jié)合。這種組合使研究人員能夠建立空前強大的應(yīng)用,將量子計算與最先進的經(jīng)典計算相結(jié)合,實現(xiàn)校準、控制、量子糾錯和混合算法。

英偉達公司 HPC 和量子主管 Tim Costa 表示:“量子加速的超級計算有可能重塑科學和工業(yè),英偉達 DGX Quantum 將使研究人員能夠突破量子 - 經(jīng)典計算的界限?!?/p>

對此,英偉達將高性能的 Hopper 架構(gòu) GPU 與該公司的新 Grace CPU 整合為”Grace Hopper“,為巨型 AI 和 HPC 應(yīng)用提供了超強的動力。它為運行 TB 級數(shù)據(jù)的應(yīng)用提供了高達 10 倍的性能,為量子 - 經(jīng)典研究人員解決世界上最復(fù)雜的問題提供了更多動力。

總 結(jié)

在本次GTC大會上,黃仁勛說道,“加速計算并非易事,2012年,計算機視覺模型AlexNet動用了GeForce GTX 580,每秒可處理262 PetaFLOPS。該模型引發(fā)了AI技術(shù)的爆炸。”

“十年之后,Transformer出現(xiàn)了,GPT-3動用了323 ZettaFLOPS的算力,是AlexNet的100萬倍,創(chuàng)造了ChatGPT這個震驚全世界的AI。嶄新的計算平臺出現(xiàn)了,AI的‘iPhone時刻’已經(jīng)來臨。”

顯然,手握GPU算力技術(shù)的英偉達抓住了AI的關(guān)鍵時刻,在大模型軍備競賽中,英偉達贏得盆滿缽滿。ChatGPT在全球的爆火,就讓英偉達股價飆升市值直接增加700多億美元。

目前,英偉達市值為6400億美元。而在Microsoft 365, Azure,Stable Diffusion,DALL-E……時下最紅的AI產(chǎn)品中,英偉達都能分得一杯羹。

從大會發(fā)布的內(nèi)容來看,英偉達對先進AI計算的支撐已經(jīng)覆蓋到從GPU、DPU等硬件到幫助企業(yè)加速構(gòu)建定制生成式AI模型的云服務(wù)?;蛟S正如黃仁勛所說,AI行業(yè)的”iPhone時刻“已來臨,創(chuàng)業(yè)公司正在競相建立顛覆式的商業(yè)模型,業(yè)界巨頭也在尋找應(yīng)對之道。

而英偉達正在成為AI“背后的巨人”。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    30896

    瀏覽量

    269108
  • 光刻技術(shù)
    +關(guān)注

    關(guān)注

    1

    文章

    146

    瀏覽量

    15827
  • 英偉達
    +關(guān)注

    關(guān)注

    22

    文章

    3776

    瀏覽量

    91111

原文標題:黃教主深夜丟“核彈”,加速光刻領(lǐng)域2nm制程、最新GPU提速10倍……

文章出處:【微信號:WW_CGQJS,微信公眾號:傳感器技術(shù)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    一文看懂光刻機的結(jié)構(gòu)及雙工件臺技術(shù)

    ? 集成電路作為現(xiàn)代信息技術(shù)的核心與基石,其發(fā)展一直遵循著Intel創(chuàng)始人之一戈登·摩爾提出的摩爾定律:價格不變時,約每隔18-24個月,集成度增加一,性能也隨之提升一。隨著這一趨勢的延續(xù)
    的頭像 發(fā)表于 11-22 09:09 ?1114次閱讀
    一文看懂<b class='flag-5'>光刻</b>機的結(jié)構(gòu)及雙工件臺<b class='flag-5'>技術(shù)</b>

    AI高性能計算平臺是什么

    AI高性能計算平臺不僅是AI技術(shù)發(fā)展的基石,更是推動AI應(yīng)用落地、加速產(chǎn)業(yè)升級的重要工具。以下,是對AI
    的頭像 發(fā)表于 11-11 09:56 ?195次閱讀

    AI技術(shù)驅(qū)動半導體產(chǎn)業(yè)升級,原布局未來智能計算領(lǐng)域

    隨著AI技術(shù)在高性能計算、機器學習和深度學習等領(lǐng)域的廣泛應(yīng)用,對高性能芯片的需求日益增長,這直接推動了半導體產(chǎn)業(yè)的迅猛發(fā)展和升級。在2024全球CEO峰會上,原執(zhí)行副總裁、業(yè)務(wù)運營部
    的頭像 發(fā)表于 11-06 13:53 ?444次閱讀

    AI for Science:人工智能驅(qū)動科學創(chuàng)新》第二章AI for Science的技術(shù)支撐學習心得

    計算的結(jié)合 我深刻體會到高性能計算(HPC)在AI for Science中的重要性。傳統(tǒng)的科學計算往往面臨計算量大、
    發(fā)表于 10-14 09:16

    光刻掩膜版制作流程

    使用計算機輔助設(shè)計(CAD)軟件來實現(xiàn)。設(shè)計好后,會生成一個掩模圖案的數(shù)據(jù)文件。 2. 選擇基板 選擇適當?shù)幕宀牧鲜侵谱?b class='flag-5'>光刻掩膜的重要環(huán)節(jié)。常用的基板材料是石英或玻璃?;鍛?yīng)該具有高透明度、低膨脹系數(shù)、高抗拉強度等特性。 3. 涂覆
    的頭像 發(fā)表于 09-14 13:26 ?634次閱讀

    騰訊推出自主研發(fā)的AI引擎,工作效率提升超40

    隆重推出了自主研發(fā)的AI引擎,該引擎在加速游戲場景構(gòu)建與內(nèi)容創(chuàng)作流程方面展現(xiàn)出非凡能力,實現(xiàn)了工作效率超過40的提升。
    的頭像 發(fā)表于 07-30 17:07 ?628次閱讀

    元智發(fā)布“愛通元AI處理器”

    在近日隆重召開的世界人工智能大會(WAIC)這一全球科技盛會上,愛元智科技有限公司憑借其深厚的AI技術(shù)研發(fā)實力,正式推出了劃時代的“愛通元AI
    的頭像 發(fā)表于 07-09 09:35 ?418次閱讀

    NextCentury利用科科技技術(shù)釋放無線輔助計量潛力

    想象一下這樣的世界:漏水的廁所能發(fā)出短信警報,使用水浪費減少數(shù)十億加侖,公寓居民對公平的電費賬單感到滿意。這就是NextCentury 公司通過采用Silicon Labs(亦稱“
    的頭像 發(fā)表于 06-17 11:05 ?597次閱讀

    斯坦福大學研發(fā)全新AI輔助全息成像技術(shù)

    據(jù)最新消息,斯坦福大學的研究人員成功研制出全新AI輔助全息成像技術(shù),其薄度、重量及質(zhì)量均超過了當前方案,有望推動增強現(xiàn)實(AR)眼鏡領(lǐng)域的發(fā)展。
    的頭像 發(fā)表于 05-10 14:48 ?583次閱讀

    40 W SiC高壓輔助電源SECO-HVDCDC1362-40W-GEVB數(shù)據(jù)手冊

    電子發(fā)燒友網(wǎng)站提供《40 W SiC高壓輔助電源SECO-HVDCDC1362-40W-GEVB數(shù)據(jù)手冊.rar》資料免費下載
    發(fā)表于 04-25 16:08 ?2次下載
    <b class='flag-5'>40</b> W SiC高壓<b class='flag-5'>輔助</b>電源SECO-HVDCDC1362-<b class='flag-5'>40</b>W-GEVB數(shù)據(jù)手冊

    NVIDIA BioNeMo全新基礎(chǔ)模型拓展對計算輔助藥物研發(fā)的支持

    Cadence、Iambic Therapeutics 等 100 多家公司采用 NVIDIA AI 來推動計算輔助藥物研發(fā)和生成式 AI 的發(fā)展。
    的頭像 發(fā)表于 03-25 11:01 ?490次閱讀

    NanoEdge AI技術(shù)原理、應(yīng)用場景及優(yōu)勢

    NanoEdge AI 是一種基于邊緣計算的人工智能技術(shù),旨在將人工智能算法應(yīng)用于物聯(lián)網(wǎng)(IoT)設(shè)備和傳感器。這種技術(shù)的核心思想是將數(shù)據(jù)處理和分析從云端轉(zhuǎn)移到設(shè)備本身,從而減少數(shù)據(jù)傳
    發(fā)表于 03-12 08:09

    什么是AI邊緣計算AI邊緣計算的特點和優(yōu)勢介紹

    隨著人工智能的迅猛發(fā)展,AI邊緣計算成為了熱門話題。那么什么是AI邊緣計算呢?簡單來說,它是將人工智能技術(shù)引入邊緣
    的頭像 發(fā)表于 02-01 11:42 ?900次閱讀

    荷蘭AI芯片設(shè)計公司Axelera計劃推出新型汽車AI架構(gòu)

    荷蘭邊緣人工智能(AI)芯片設(shè)計領(lǐng)域的領(lǐng)軍企業(yè)Axelera AI Solutions正在積極開發(fā)一款新型的汽車粒(chiplet)內(nèi)存計算AI
    的頭像 發(fā)表于 01-18 18:24 ?1832次閱讀

    人工智能CEO王維:需要重新定義和設(shè)計AI計算

    AI時代,我們需要重新定義和設(shè)計AI計算機。僅依靠硅基的摩爾定律,2年翻一的線性增長的算力供給遠不能滿足指數(shù)級增長的需求問題。
    的頭像 發(fā)表于 01-12 11:12 ?1089次閱讀