首先說明一點,我從來都不是OCP的歌頌者,對我來看,他們就是在做一些奇奇怪怪的東西(hack精神),和富士康的黑燈工廠一樣,除了給iphone打工以外,沒有其他的推廣價值。
這個觀點的來源是本人職業(yè)生涯中的一個關鍵點,在2011年的第一屆OCP大會。當時Dell的DCS group經(jīng)過艱苦的斗爭打敗了AWS和Facebook的大server供應商Rackable System[1], 正準備大展宏圖,成為數(shù)據(jù)中心的硬件之王。但是OCP來了,其中的一張照片最說明問題[2]:
Forrest肯定是笑不起來的,他剛剛從一個D火箭升到了SVP,正要“乘風破浪”,結果有人告訴他,現(xiàn)在是“吐槽大會”了。后面的故事,業(yè)內的人都知道了。Rackable system變成SGI后被HPE收購,美國的數(shù)據(jù)中心被臺灣同胞占領了。自己這個深有體會,在2009年左右的時候去找昆山產(chǎn)線上的高手修板子,他們的工廠在下午三點就關了空調,說主要是因為6點準時下班,到了下班時大家就內外一個溫度了。當然,這個就是現(xiàn)在最流行的“內卷”思想了。臺灣公司的上位其實是技術的悲哀。
因為這個原因,自己雖然一直在數(shù)據(jù)中心討生活,但是一直有意無意地遠離OCP。當然,OCP也在茁壯成長,facebook因為不做云計算,和其他公司沒有明顯競爭,微軟,Google也都把自己的內部項目貢獻了出來。在2017年的時候。Microsoft貢獻了Project olympus [3], 基本上讓高通差點丟了老命。教育一下不知道內情的小伙伴,Microsoft的人認為ARM64在服務器市場有前景,鼓勵富裕的小伙伴高通來擴大業(yè)務,結果一直很冷靜,不參與任何OCP項目的Hock Tan同學一看,機會來了,想一舉拿下不務正業(yè)的高通。結果嚇得高通直接退出數(shù)據(jù)中心[4],同時對于國內的ARM服務器生態(tài)一通重擊。
因此,對于OCP的項目,我都是“謹慎樂觀”。但是往往出于撿垃圾的習慣,就很關注那些不是標準服務器的項目。比如,2018年的Microsoft的另一個Project Denali[5]我就一直持了懷疑的態(tài)度。
原因是之前已經(jīng)看到了另一個Project Denali的競爭者的尸體。[6]. 整個項目都開源在github,上次去印度研發(fā)中心的時候遇到一個做這個項目的印度小伙,笑稱可以拿這些資料開一家公司。但是IT這個行業(yè)就是這么殘酷,淘汰的技術,只會被遺忘。我只能祝福那些拿這個“洋垃圾”辦公司的朋友了。
OCP 2019的時候,另一個項目也被我關注了,原因是我客戶中的很多很牛逼的軟件工程師嘴里都有一個名詞“chiplets”,而且是和“DSA”(故意不解釋,看不懂的朋友請回了”聯(lián)系在一起?;旧暇褪牵煌?a href="http://wenjunhu.com/tags/asic/" target="_blank">ASIC的功能不一樣,大家一起坐下來,像攢服務器一樣攢個芯片。畢竟,過去大家都已經(jīng)成功地攢了很多服務器。
這個項目就是
這個NFP感覺很眼熟,定睛一看原來是netronome的芯片,這家公司應該算是老相識了。我上一個老板就是他們的VP,一個住在東海岸boston的老美。第一在深圳相見的時候,他主動要吃湘菜,他說之前去南山區(qū)的時候就好這口,只是netronome在關鍵時間點敗給了Mellanox,之后就沒有之后了。對于NFP,一切要從Flow processor說起。Intel 22nm的第一個flow processor。
從架構上也是那段眾核熱的產(chǎn)物,和被Mellanox收購的ezchip類似。在使用TCAM做包處理的基礎上再前進一步,不僅在match階段,在action階段也是基于flow。
第一個問題就是好靈活呀,固件同學很辛苦。
果然在網(wǎng)站上看到了很多軟件。
從硬件角度來講,基于SRAM的確是延時最低的。這個比現(xiàn)在大家做的in-memory computing的架構都先進,除了難編程和擴展性差。
當然,和第8期的IBM 一樣,也有數(shù)據(jù)加速單元。
這里要講一下,他的string matching技術還是很不錯的,Sakir Sezer后面搞了一家做Reg-EX的公司,2019年被Mellanox 收購,并放在他們的Bluefield2的DPU中。
一個22nm的網(wǎng)卡芯片,沒有25G的serdes,在現(xiàn)在的市場如何生存??戳艘幌?a target="_blank">產(chǎn)品。原來和之前的Intel一樣。2x40G改2x25G,這樣的話,成本和功耗估計都沒有優(yōu)勢。在我常去的HPC和數(shù)據(jù)中心部件的網(wǎng)點,沒有人敢賣2X25G超過300$, 連一直是最貴的chelsio的T6也只要285$.
作為從業(yè)人員,其實很理解這種悲涼。沒有資金流下一代的芯片,一直用14nm++++++來對抗AMD這樣的事,也就Intel可以干。記得上次換工作的時候,有家NVDIMM-F的公司拉我入伙,他們當時自己流片的DDR3的控制器,等到了DDR4的時候,他們已經(jīng)在用我司的產(chǎn)品了,沒資金流DDR4了,趕不上技術發(fā)展,IT行業(yè)的淘汰太殘酷了。
回到ODSA,也看了他們的whitepaper,例子就是Smartnic。
CPU Chiplet 是Free的RISC-V,I/O Chiplet應該就是serdes,覺得中間那個switching chiplet應該就是NFP了吧。不過,真的要做這個,個人覺得可以用商用的TCAM[7]也行吧。至于Domain Chiplets,我大膽地估計他們會對互聯(lián)網(wǎng)新貴們講,“這個是你們的應用!!!”
從最初的構想到現(xiàn)在最新的update,個人認為已經(jīng)有一些偏差了。這個最新的project的進展:
沒有了netronome的NFP的身影,而是一個NIC+FPGA+CPU的路,大家看到這個估計會笑了。目前國內的大部分smartnic已經(jīng)開始從NIC+FPGA+CPU演進到了FPGA+CPU的階段。不知道這些人target的用戶到底是那些人。不過其中的OCP3.0的網(wǎng)卡規(guī)格的確是個好東西。2X100G的網(wǎng)卡數(shù)據(jù)中心標準,連Dell的服務器上都用上了。
對了,事情都是人在做,發(fā)現(xiàn)netronome公司的變化也挺大,
OCP Server/ODSA Project Leader Bapi 離開了公司,原來做編譯器的華人大佬也去了華為英研做編譯器。而整個公司的靈魂人物Gavin 居然離開了公司。
因為“新冠疫情”,這個我最近注意到第二個人。
還有一個是Nutainx 的CEO。[8] 隱隱感覺下一篇也有了著落。OCP已經(jīng)快10年了,只要ticktok被打壓,F(xiàn)acebook應該會一直玩下去,最新的美國國會作證讓小馬哥很火,估計他們也放棄了,畢竟我們在微信,頭條和抖音的關照下沒功夫理這個臉書了。
原文標題:互聯(lián)網(wǎng)新貴搞OCP十年了,到底行不行?
文章出處:【微信公眾號:ssdfans】歡迎添加關注!文章轉載請注明出處。
責任編輯:haq
-
互聯(lián)網(wǎng)
+關注
關注
54文章
11166瀏覽量
103442 -
OCP
+關注
關注
0文章
79瀏覽量
16453 -
AWS
+關注
關注
0文章
432瀏覽量
24398
原文標題:互聯(lián)網(wǎng)新貴搞OCP十年了,到底行不行?
文章出處:【微信號:SSDFans,微信公眾號:SSDFans】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
相關推薦
評論