將數(shù)以億計的晶體管集成到指甲蓋大小的芯片上,并不斷提高其集成密度,是過去幾十年提高芯片算力的主要方法,也是引領業(yè)界超過半個世紀之久的摩爾定律的核心內(nèi)容。但由于人工智能、大數(shù)據(jù)、物聯(lián)網(wǎng)等產(chǎn)業(yè)急速發(fā)展,數(shù)字經(jīng)濟浪潮席卷而來,作為核心生產(chǎn)力的算力需求激增,逐漸與芯片自身的物理極限產(chǎn)生矛盾,曾被視為“金科玉律”的摩爾定律正面臨失效的窘境。
光或?qū)⒊蔀榻鉀Q這一問題的突破口?光子具有高通量、低延遲、低能耗的優(yōu)勢,且不易受到溫度、電磁場和噪聲變化的影響。此前,光子技術常被應用于長距離通信傳輸領域,光纖通信已成為各種通信網(wǎng)的主要傳輸方式。然而,光在人類社會進步中可發(fā)揮的作用可能遠比我們想象中來得更大、更重要。
曦智科技率先將目光投向光領域,提出開創(chuàng)性的“光電混合計算新范式”概念,試圖給集成電路產(chǎn)業(yè)提供一個區(qū)別于目前傳統(tǒng)芯片計算范式的全新“解題思路”。近期,曦智科技CTO孟懷宇博士在“DeepTech科技創(chuàng)新周先進計算論壇”上以“計算需求大爆發(fā)下的光電混合計算新范式”為主題,對這一概念進行了詳細介紹。
從光計算開始的新革命
所謂光計算,是指利用光的物理特性完成線性計算。孟懷宇博士以生活中常見的光計算——眼鏡為例,指出了光計算的三大優(yōu)勢。
首先是低延遲,眼鏡后的觀察者感知到眼鏡前的圖像變化所需時間等于以光速穿越這一段距離所耗的時間——幾乎微乎其微;其次是低能耗,眼鏡放置在那里本身并不消耗能量,所有能量都消耗在光信號的產(chǎn)生與吸收;最后是高通量,當光信號發(fā)生高速變化時,眼鏡后接收的信息也會發(fā)生高速變化,即眼鏡的二維傅里葉變換正在進行高速的大通量計算。
雖然眼鏡不可編程,但它的原理為光計算的實現(xiàn)帶來了靈感。為了用光來實現(xiàn)一個可編程的真正有用的計算系統(tǒng),曦智科技創(chuàng)始人兼CEO沈亦晨博士開創(chuàng)性地提出了利用集成光子技術實現(xiàn)深度學習的全新計算架構,并于2017年創(chuàng)立曦智科技。2019年,曦智科技發(fā)布了全球首款光子芯片原型板卡,成功驗證了以光子替代電子進行高性能計算的開創(chuàng)性想法。2021年,在此基礎上,曦智科技團隊又發(fā)布了高性能光子計算處理器PACE(Photonic Arithmetic Computing Engine,光子計算引擎),通過重復矩陣乘法和巧妙利用受控噪聲組成的緊密回環(huán)來實現(xiàn)低延遲,從而生成了伊辛問題(Ising)的高質(zhì)量解決方案。
孟懷宇博士表示:“ PACE主要利用了光計算的低延遲優(yōu)勢。其可在3納秒內(nèi)完成伊辛問題單次迭代計算,速度達到目前高端GPU的800倍以上?!?/p>
PACE與目前高端GPU性能對比
光互聯(lián),光電混合計算新范式的另一半
“光電混合計算新范式”的另一半重點則是解決數(shù)據(jù)互聯(lián)問題,即“內(nèi)存墻”(memory wall)問題,主要包括容量和帶寬兩部分內(nèi)容。算力爆發(fā)的今天,相應硬件的增長速度卻望塵莫及。以AI典型模型Transformer為例,兩年時間,算法大小提升240倍的背后是硬件存儲容量僅提高2倍的事實。因此出現(xiàn)了內(nèi)存墻的容量瓶頸,即如何容納更大的應用程序。
另一大挑戰(zhàn)則是帶寬瓶頸。孟懷宇博士解釋道,如果將芯片想象成一個平面方塊,則芯片算力與方塊的面積成正比,而芯片對外的帶寬與其邊長成正比。因此,當芯片上晶體管密度越來越高時,如果將芯片的邊長密度提高2倍,算力密度就將提高4倍。因此,無論是摩爾定律越往前走,還是通過新的計算范式來提高單位面積的算力,“喂飽”算力所需的帶寬就越將成為問題。在過去的20年中,硬件的算力提升了9萬倍,但DRAM帶寬及網(wǎng)絡帶寬只提升了30倍。
曦智科技給出的解決方案是一種數(shù)據(jù)互聯(lián)的新范式——光互聯(lián)。相較于電互聯(lián)的性能會隨距離增長而逐漸下降,光互聯(lián)受距離的影響則小得多。孟懷宇博士表示:“理想情況下,對超過10毫米的數(shù)據(jù)傳輸,使用光互聯(lián)更具優(yōu)勢,它能為解決帶寬瓶頸與容量瓶頸帶來更大可能,這也是曦智科技對光互聯(lián)新范式的底層邏輯?!?/p>
光互聯(lián)與電互聯(lián)對比
目前,光互聯(lián)解決方案已被應用于數(shù)據(jù)中心中,但由于光模塊與使用光模塊的數(shù)字芯片的距離往往在1米以上,光互聯(lián)就被電互聯(lián)所限制了,從而導致光互聯(lián)的應用范圍被局限于機架之間,機架內(nèi)部,甚至服務器內(nèi)部的光互聯(lián)使用非常少。為消除電互聯(lián)的瓶頸,曦智科技所倡導的光互聯(lián)新范式就是將光電轉(zhuǎn)換和數(shù)字芯片高度集成,形成“芯片出光”,并以此拓寬眾多計算范式的可行性。孟懷宇博士將目前數(shù)據(jù)中心的“資源池化”趨勢作為例子,他表示:“我會把這種大范圍的資源池化理解成計算資源的‘共享經(jīng)濟’。目前一個服務器要去訪問另一個服務器的資源會比較困難,因為它們的互聯(lián)性較差。而光互聯(lián)就可以幫助實現(xiàn)更好的互聯(lián)性,讓大范圍的資源共享變成可能。最終通過資源池化,我們可以讓每一個計算芯片都能訪問更大的內(nèi)存,有更大的帶寬,從而解決內(nèi)存墻問題?!?/p>
光互聯(lián)讓數(shù)據(jù)中心“資源池化”變?yōu)榭赡?/p>
超大規(guī)模光電混合集成是實現(xiàn)以上一切的底層技術。對此,曦智科技也已完成了相關技術驗證,成功將一塊集成硅光芯片和一塊電子芯片以3D封裝形式垂直堆疊,使兩塊芯片之間的距離變得最小,實現(xiàn)了比現(xiàn)有的 Transceiver高1000倍以上的集成密度。
最后,孟懷宇博士還介紹了曦智科技“光電混合晶圓級計算平臺”解決方案。如今,業(yè)界許多公司推出了“晶圓級計算平臺”的概念,即通過更大的芯片面積來實現(xiàn)更高的性能,如Cerebras公司的WSE芯片。但它們的局限也顯而易見:首先由于電不適合長距離通信,因此只能進行最近鄰數(shù)據(jù)傳輸;其次,它們將面臨更為嚴重的“內(nèi)存墻”問題。對此,“光電混合晶圓級計算平臺”解決方案通過晶圓級片上光互聯(lián),實現(xiàn)任意互聯(lián)拓撲、低延遲及低能耗。同時,為了打破“內(nèi)存墻”,可設立一個遠端的資源池,并通過高效率的光互聯(lián),直接接入晶圓級計算平臺內(nèi)部的光網(wǎng)絡,最終實現(xiàn)所有計算資源的最優(yōu)配置。
責任編輯:彭菁
-
數(shù)據(jù)中心
+關注
關注
16文章
4844瀏覽量
72286 -
光互聯(lián)
+關注
關注
0文章
6瀏覽量
6787
發(fā)布評論請先 登錄
相關推薦
評論