欧美久久熟妇成人精品,日韩免费高清大片在线

近年來，數(shù)據(jù)中心網(wǎng)絡技術一直在不斷發(fā)展，以滿足日益增長的數(shù)據(jù)處理需求。從最初的傳統(tǒng)結構，到軟件定義網(wǎng)絡（SDN），再到云原生網(wǎng)絡（CN-NFV），數(shù)據(jù)中心網(wǎng)絡技術已經(jīng)走過了一個漫長的發(fā)展歷程。AI時代，高性能計算需求正呈現(xiàn)爆發(fā)性增長態(tài)勢，數(shù)據(jù)中心網(wǎng)絡面臨更為復雜的挑戰(zhàn)，技術將會有哪些新的變化？是否有合適的解決之道？

華為數(shù)據(jù)通信產品線數(shù)據(jù)中心網(wǎng)絡領域副總裁張白

2023年8月23日-25日，全國高性能計算學術年會(CCF HPC China 2023)在青島舉辦，CCF HPC China是高性能計算領域全球最具影響力的三大超算盛會之一，有著“中國超算風向標”的稱號。本次大會上，華為數(shù)據(jù)通信產品線數(shù)據(jù)中心網(wǎng)絡領域副總裁張白分享隨著AI時代的到來，高性能計算對網(wǎng)絡新的訴求，以及如何依靠星河AI網(wǎng)絡解決方案去解決智能時代網(wǎng)絡面臨的新的挑戰(zhàn)。

高性能計算需要什么樣的互聯(lián)網(wǎng)絡？

當前，新一輪科技革命和產業(yè)變革加速演進，高性能計算正帶領人類從“信息時代”走向“算力時代”。據(jù)中國電子信息產業(yè)發(fā)展研究院發(fā)布的《2022中國數(shù)字經(jīng)濟發(fā)展研究報告》顯示，目前中國算力規(guī)模約占全球的27%，排名第二。我國算力進入高速發(fā)展階段，到2025年總算力規(guī)模將達到300EFlops，同比2020年增長120%。

數(shù)據(jù)的爆炸性增長需要算力去解決，一方面需要更高效的算力結構，另一方面需要好的算力網(wǎng)絡。高性能計算主要關注如何利用大規(guī)模計算的資源來解決科學、工程和商業(yè)問題。HPC應用程序通常需要使用并行計算，億級、10億級的超算，它的并行計算帶給網(wǎng)絡非常大的挑戰(zhàn)。比如，并行通信、數(shù)據(jù)同步、大規(guī)模穩(wěn)定運行等。同時，隨著AI人工智能快速發(fā)展，HPC和AI結合的研究，HPC和AI應用程序通常需要處理大量的數(shù)據(jù)，并且在計算節(jié)點之間進行數(shù)據(jù)傳輸和存儲，對網(wǎng)絡的吞吐及負載均衡也提出了新的挑戰(zhàn)。

以當前火爆的大模型來說，其對數(shù)據(jù)中心網(wǎng)絡要求更為苛刻，可以說，大規(guī)模算力環(huán)境下的網(wǎng)絡問題已成為當今數(shù)據(jù)中心所面臨的“緊箍咒”之一。

官網(wǎng)顯示，ChatGPT-4輸入參數(shù)已經(jīng)達到萬億，2.5年增長了570倍，1.5萬張A100卡來支撐訓練，大量服務器通過高速網(wǎng)絡組成算力集群，共同完成訓練任務。但是大規(guī)模不等于大帶寬，AI大模型的訓練場景中會存在負載不均衡的情況，而且設備網(wǎng)絡規(guī)模越大，傳統(tǒng)負載方式?jīng)_突會越嚴重。類似于要想提高車輛運行速度，在拓寬道路的基礎上，還需要解決堵車的難題。大規(guī)模的網(wǎng)絡不僅讓業(yè)務調優(yōu)復雜，后期運維也是雪上加霜，無法采用傳統(tǒng)手段運維，據(jù)統(tǒng)計50%的迭代過程會被迫中斷，定位時長平均1天以上。由此可見，AI訓練對于網(wǎng)絡的訴求可以用三個詞來歸納：大規(guī)模，高吞吐，高可靠。

如何釋放高性能計算100%算力？

加大高性能計算供給，必須增加算力網(wǎng)絡可靠性。自2020年至今，大模型引領AI進入新的發(fā)展階段，但大模型訓練是個復雜的系統(tǒng)工程，網(wǎng)絡基礎設施正是長穩(wěn)訓練的關鍵之一。對于用戶來說，其需要投入大量的資金和人才戰(zhàn)略來施行其智能化戰(zhàn)略，要怎樣才能進行數(shù)據(jù)中心的創(chuàng)新，建立其符合未來需求的數(shù)據(jù)中心網(wǎng)絡呢?

針對當前業(yè)界火爆的AI大模型，華為在2023CCF全國高性能計算學術年會（CCF HPC China 2023）上帶來星河AI網(wǎng)絡解決方案，提供“運得多、運得快，運得穩(wěn)”的高運力數(shù)據(jù)中心網(wǎng)絡，為客戶提供大規(guī)模、高吞吐、高可靠的網(wǎng)絡建設。

AI場景下對網(wǎng)絡的第一要求是大規(guī)模，適配萬卡集群是網(wǎng)絡最基本的要求。華為采用業(yè)界最高密200/400GE交換機，匹配大模型訓練基本硬件算力訴求，支持超大帶寬組網(wǎng)，支持萬億參數(shù)量，規(guī)模可以達到IB的2-4倍。

網(wǎng)絡的另一個要求是高吞吐，面對大規(guī)模網(wǎng)絡采用算網(wǎng)一體化的方式部署，效率可以提升10倍以上。在AI場景中網(wǎng)絡時延不是關鍵指標，而網(wǎng)絡吞吐才是業(yè)務性能的關鍵因素，華為獨創(chuàng)AI智能加速器，提高網(wǎng)絡吞吐，訓練效率提升20%。

高可靠同樣是客戶對網(wǎng)絡的重要要求，華為采用智能化運維的方式來保證訓練實時可視分鐘級識別慢主機，保證訓練的過程不中斷。通過采用網(wǎng)絡的控制器，包括網(wǎng)絡以及計算強強聯(lián)手，實現(xiàn)“算網(wǎng)一體的融合”，最終實現(xiàn)算力網(wǎng)絡“運得多，運得快，運得穩(wěn)”的目標，從而實現(xiàn)算力100%釋放。

進入AI時代，數(shù)據(jù)中心的使命正在從聚焦業(yè)務快速發(fā)放向聚焦數(shù)據(jù)高效處理進行轉變，計算、存儲、網(wǎng)絡等這些IT基礎設施的核心組成部分，正在融入更多的AI元素。企業(yè)如果想要打造未來型數(shù)據(jù)中心，就必須尋找優(yōu)秀的技術合作伙伴，致力于提供一套更好的網(wǎng)絡基礎設施。華為星河AI網(wǎng)絡解決方案通過構建支持AI業(yè)務的網(wǎng)絡，實現(xiàn)從大型模型訓練到推理的全過程。目前，華為星河AI網(wǎng)絡解決方案已在成全球100+企業(yè)部署商用。

如何打造面向未來的AI 網(wǎng)絡？

到2030年，全球聯(lián)接數(shù)預計將達到2000億，數(shù)據(jù)中心流量10年增長100倍，IPv6地址滲透率將達到90%，AI算力將增長500倍。當前及未來的數(shù)據(jù)中心將如何應對這些趨勢和發(fā)展要求?這就需要構建一個立體超寬、滿足確定性時延的智能原生AI網(wǎng)絡。在華為看來，AI網(wǎng)絡的所有技術手段，都需要以業(yè)務為本，核心指標就是減少模型的訓練時間。

首先，大模型需要規(guī)模算力，需要非常大的GPU集群。而把大規(guī)模的GPU集群連起來，需要大規(guī)模的網(wǎng)絡。對于數(shù)據(jù)中心網(wǎng)絡而言，大規(guī)模網(wǎng)絡本身不是問題，更重要的是要考量建網(wǎng)的成本。華為主張采用大容量的交換設備組網(wǎng)降低網(wǎng)絡的層次，由原來的三層合適組網(wǎng)變成兩層寬河組網(wǎng)，從而來降低組網(wǎng)的成本。

其次，大規(guī)模的集群只是把AI物理服務器物理上連接在一起，要發(fā)揮效果還需要釋放集群算力。網(wǎng)絡在提高集群的加速比上需要發(fā)揮更加關鍵的作用。

最后，AI訓練的本質是并行計算，有典型的木桶效應，水桶的盛水量是由幾塊木板中最短的一塊決定的。一個環(huán)節(jié)出問題，會拉慢整個系統(tǒng)甚至讓整個系統(tǒng)癱瘓。網(wǎng)絡需要盡可能多的保障服務器之間的連通性，對網(wǎng)絡的高可靠需求更高。未來網(wǎng)絡要提高集群的整體可用性，做到在99%的情況下都不會因為網(wǎng)絡導致訓練中斷。

在過去20年，網(wǎng)絡技術獲得了長足發(fā)展——2000年開始的ALL IP技術推動了互聯(lián)網(wǎng)的大規(guī)模應用，2010年開始的All Cloud技術驅動了企業(yè)IT基礎設施的大規(guī)模云化。而今天，AI浪潮正撲面而來，持續(xù)演進的AI對網(wǎng)絡的需求將會處于指數(shù)級增長的態(tài)勢，網(wǎng)絡也需要全面擁抱人工智能時代。在這個過程中，華為將繼續(xù)攜手伙伴開放合作與持續(xù)創(chuàng)新，在算力領域的發(fā)展和應用中作出更大的貢獻。

點擊“閱讀原文”，了解更多華為數(shù)據(jù)通信資訊！

原文標題：轉載 | 高性能計算與AI網(wǎng)絡大融合，如何重塑網(wǎng)絡智能時代？

文章出處：【微信公眾號：華為數(shù)據(jù)通信】歡迎添加關注！文章轉載請注明出處。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

華為

華為

+關注

關注
216

文章
34462

瀏覽量
251842

原文標題：轉載 | 高性能計算與AI網(wǎng)絡大融合，如何重塑網(wǎng)絡智能時代？

文章出處：【微信號：Huawei_Fixed，微信公眾號：華為數(shù)據(jù)通信】歡迎添加關注！文章轉載請注明出處。

華為星河AI網(wǎng)絡共贏行業(yè)智能化

近日，華為年度旗艦活動——HUAWEI CONNECT 2024·PARIS開幕。大會期間，星河AI網(wǎng)絡論壇成功舉辦，200+名全球行業(yè)領袖、技術專家和合作伙伴參加，共同探討智能時代下

發(fā)表于 11-18 11:29 ?365次閱讀

AI高性能計算平臺是什么

AI高性能計算平臺不僅是AI技術發(fā)展的基石，更是推動AI應用落地、加速產業(yè)升級的重要工具。以下，是對AI

發(fā)表于 11-11 09:56 ?198次閱讀

InfiniBand網(wǎng)絡內計算的關鍵技術和應用

InfiniBand在高性能計算（HPC）和人工智能（AI）應用中發(fā)揮著關鍵作用，體現(xiàn)在它提供了高速、低延遲的網(wǎng)絡通信能力，以支持大規(guī)模數(shù)據(jù)

發(fā)表于 10-23 11:33 ?367次閱讀

《AI for Science：人工智能驅動科學創(chuàng)新》第二章AI for Science的技術支撐學習心得

人工智能在科學研究中的核心技術，包括機器學習、深度學習、神經(jīng)網(wǎng)絡等。這些技術構成了AI for Science的基石，使得AI能夠處理和分析復雜的數(shù)據(jù)集，從而發(fā)現(xiàn)隱藏在數(shù)據(jù)中的模式和規(guī)

發(fā)表于 10-14 09:16

AI云服務器：開啟智能計算新時代

，旨在為人工智能應用提供堅實的支持。特點 高性能：配備先進的處理器，如多核CPU和高性能GPU，能夠快速處理大量復雜的計算任務，滿足深度學習和機器學習模型訓練及推理的需求。可擴展性

發(fā)表于 08-09 16:08 ?893次閱讀

燧原科技與銳捷網(wǎng)絡攜手共筑AI數(shù)據(jù)中心高性能網(wǎng)絡新紀元

近日，燧原科技與知名網(wǎng)絡解決方案提供商銳捷網(wǎng)絡正式簽署戰(zhàn)略合作協(xié)議，雙方宣布將共同研發(fā)面向未來人工智能數(shù)據(jù)中心的高性能網(wǎng)絡互聯(lián)解決方案。此次

發(fā)表于 07-29 11:27 ?561次閱讀

芯品# 高性能計算芯片

（LSE：AWE）是全球技術基礎設施高速連接和計算芯片的全球領導者，與Arm合作開發(fā)基于Arm ? Neoverse?計算子系統(tǒng)（CSS）的高級計算芯片，用于人工智能/機器學習（

發(fā)表于 06-27 10:28 ?6999次閱讀

HDC2024華為發(fā)布鴻蒙原生智能：AI與OS深度融合，開啟全新的AI時代

董事長余承東先生表示：全新的Harmony Intelligence鴻蒙原生智能，將開啟全新的AI時代！ ? 軟硬芯云協(xié)同鴻蒙原生智能深度融合

發(fā)表于 06-24 09:28 ?625次閱讀

高性能計算集群的能耗優(yōu)化

、人工智能、大數(shù)據(jù)分析等。隨著高性能計算集群的規(guī)模和性能的不斷提升，其能耗問題也日益突出。高性能計算

發(fā)表于 05-25 08:27 ?436次閱讀

華為發(fā)布星河AI制造網(wǎng)絡，構筑智能制造新基座

近日，華為AI+制造行業(yè)峰會智能聯(lián)接論壇在深圳舉辦，華為攜手眾多客戶、伙伴共同探討了在AI時代背景下制造網(wǎng)絡的新趨勢和前沿解決方案。

發(fā)表于 05-19 11:08 ?572次閱讀

存內計算WTM2101編譯工具鏈資料

領先的存內計算芯片企業(yè)。公司針對AI應用場景，在全球率先商業(yè)化量產基于存內計算技術的神經(jīng)網(wǎng)絡芯片。憑借顛覆性的技術創(chuàng)新，知存科技突破傳統(tǒng)計算

發(fā)表于 05-16 16:33

HNS 2024：星河AI數(shù)據(jù)中心網(wǎng)絡，賦AI時代新動能

華為數(shù)據(jù)通信創(chuàng)新峰會2024在巴庫隆重舉辦，在“星河AI數(shù)據(jù)中心網(wǎng)絡，賦AI時代新動能”主題論壇中，華為面向中東中亞地區(qū)發(fā)布星河AI數(shù)據(jù)中心

發(fā)表于 05-15 09:15 ?663次閱讀

NVIDIA InfiniBand和UFM平臺賦能高性能AI計算

在數(shù)據(jù)驅動的時代，AI網(wǎng)絡解決方案需要在保障數(shù)據(jù)安全的前提下，實現(xiàn)對龐大數(shù)據(jù)流的快速處理和對復雜AI模型的高效訓練與推理。

發(fā)表于 03-27 13:49 ?1064次閱讀

一圖看懂星河AI數(shù)據(jù)中心網(wǎng)絡，全面釋放AI時代算力

華為中國合作伙伴大會 | 一圖看懂星河AI數(shù)據(jù)中心網(wǎng)絡，以網(wǎng)強算，全面釋放AI時代算力

發(fā)表于 03-22 10:28 ?764次閱讀

介紹一種高性能計算和數(shù)據(jù)中心網(wǎng)絡架構：InfiniBand（IB）

InfiniBand（IB）是一種高性能計算和數(shù)據(jù)中心網(wǎng)絡架構，其設計目標是通過提供低延遲、高帶寬以及可擴展性來滿足大規(guī)模計算和數(shù)據(jù)傳輸?shù)男枨蟆Ｗ屛覀兩钊肓私釯nfiniBand的基本

發(fā)表于 03-13 17:14 ?1570次閱讀