0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

華為Volcano項目為構(gòu)建云原生批量計算平臺奠定基礎(chǔ)

牽手一起夢 ? 來源:華為云 ? 作者:佚名 ? 2020-04-17 14:26 ? 次閱讀

4月10日,CNCF(云原生計算基金會)正式接納由華為云捐贈的容器批量計算項目Volcano, 迎來CNCF首個容器批量計算項目。Volcano項目的加入,將CNCF的云原生版圖進一步擴展至AI、大數(shù)據(jù)、基因等批量計算領(lǐng)域,為構(gòu)建“云原生批量計算平臺”奠定了基礎(chǔ)。

華為云CTO張宇昕表示:“ 華為云多年來一直致力于云原生技術(shù)推廣,不僅在國內(nèi)最早推出了Kubernetes云原生容器技術(shù)的商業(yè)化產(chǎn)品云容器引擎CCE和云容器實例CCI,而且在開源社區(qū)發(fā)起并領(lǐng)導了多個生態(tài)項目,幫助各行業(yè)更快地落地并實踐云原生技術(shù)。Volcano是基于Kubernetes的云原生批量計算引擎,基于華為云在AI、大數(shù)據(jù)領(lǐng)域的深厚業(yè)務(wù)積累,補齊了Kubernetes在面向AI、大數(shù)據(jù)、高性能計算等批量計算任務(wù)調(diào)度、編排等場景下的短板,向下支持鯤鵬、昇騰、X86等多元算力,向上使能TensorFlow、Spark、華為MindSpore等主流行業(yè)計算框架,讓數(shù)據(jù)科學家和算法工程師充分享受到云原生技術(shù)所帶來的高效計算與極致體驗。”

Volcano介紹

隨著Kubernetes的成熟,越來越多的企業(yè)把Kubernetes作為AI、大數(shù)據(jù)以及高性能批量計算的下一代基礎(chǔ)設(shè)施,得益于Kubernetes在應(yīng)用一致性、跨云遷移便利性、靈活任務(wù)調(diào)度等方面的優(yōu)勢,使得Kubernetes在大數(shù)據(jù)、AI、以及高性能批量計算領(lǐng)域快速得到廣泛應(yīng)用。

然而,Kubernetes作為普適的容器化解決方案,應(yīng)用到大數(shù)據(jù)、AI、高性能批量計算等專業(yè)領(lǐng)域時,仍與業(yè)務(wù)訴求存在一些差距,主要體現(xiàn)在:

?K8s的原生調(diào)度功能無法滿足計算要求

?K8s作業(yè)管理能力無法滿足AI訓練的復雜訴求

?數(shù)據(jù)管理方面,缺少計算側(cè)數(shù)據(jù)緩存能力,數(shù)據(jù)位置感知等功能

?資源管理方面缺少分時共享,利用率低

?硬件異構(gòu)能力弱

華為云容器團隊針對以上問題,推出高性能容器批量計算解決方案。

同時,為加快云原生技術(shù)在各行業(yè)的快速普及,于2019年將解決方案的核心引擎Volcano開源,Volcano在調(diào)度、作業(yè)管理、數(shù)據(jù)管理、資源管理四個方面進行了重點優(yōu)化。

? 增強了任務(wù)調(diào)度能力,如公平的調(diào)度(fair-share),組調(diào)度(gang-scheduling)

? 進一步優(yōu)化了作業(yè)管理能力,如multiple pod template能力, 更靈活的error handling機制

? 增加計算側(cè)數(shù)據(jù)緩存,提升數(shù)據(jù)的傳輸與讀取效率

? 引入多維度的綜合評分機制,實現(xiàn)資源更高效的管理和分配

? 多元算力支持:支持x86、鯤鵬和昇騰等算力

生態(tài)合作

針對不同應(yīng)用場景,Volcano已與多個主流計算框架社區(qū)完成官方合作集成,包括Kubeflow、Spark、PaddlePaddle、Horovod (MPI)、Cromwell 、MindSpore等。

Volcano彌補了Kubernetes在AI場景下的不足,為飛槳分布式深度學習對接Kubernetes提供了更好支持,PaddlePaddle on Volcano方案顯著簡化了飛槳推薦系統(tǒng)解決方案 ElasticCTR的部署落地,我們非常期待Kubernetes+Volcano+PaddlePaddle的整套開源部署方案更加成熟完善,給AI開發(fā)者帶來更大便利”。

—飛槳(PaddlePaddle)總架構(gòu)師于佃海

MindSpore是華為開源的一款支持端邊云全場景的深度學習訓練推理框架,當前主要應(yīng)用于計算機視覺、自然語言處理等AI領(lǐng)域,旨在為數(shù)據(jù)科學家和算法工程師提供設(shè)計友好、運行高效的開發(fā)體驗,提供昇騰AI處理器原生支持及軟硬件協(xié)同優(yōu)化。Volcano開源項目將有助于提升Kubernetes對AI任務(wù)的調(diào)度能力支持,有利于MindSpore等深度學習框架更加有效的部署,為AI和云原生兩大領(lǐng)域的攜手共創(chuàng)繁榮開源生態(tài)打下了堅實的基礎(chǔ)。

—MindSpore社區(qū)技術(shù)委員會主席、華為MindSpore首席科學家陳雷教授

Volcano自2019年6月宣布開源以來,受到了廣泛的關(guān)注和支持,來自15家大企業(yè)/機構(gòu)的80+核心開發(fā)者參與了社區(qū)開發(fā)及貢獻。

商業(yè)應(yīng)用

目前,Volcano已在華為云容器批量計算解決方案商用,并支撐多家國內(nèi)外頭部企業(yè)應(yīng)用于AI、大數(shù)據(jù)、基因等計算場景。Volcano支持批量任務(wù)與容器的快速發(fā)放,最快每秒可發(fā)放1000容器,并提供公平調(diào)度、隊列調(diào)度等高級功能,同時與華為鯤鵬、昇騰處理器深度融合,打造更高性能、更高性價比的容器批量計算解決方案。

未來可期

此次CNCF正式將Volcano接納為云原生領(lǐng)域唯一容器批量計算項目,將極大促進Volcano上下游社區(qū)生態(tài)構(gòu)建及合作,吸引廣大云原生企業(yè)用戶深度參與,Volcano將在企業(yè)數(shù)字化、云原生轉(zhuǎn)型過程中發(fā)揮越來越重要的作用,華為云也將在云原生領(lǐng)域持續(xù)耕耘、持續(xù)引領(lǐng)創(chuàng)新、繁榮生態(tài),助力各行業(yè)走向快速智能發(fā)展之路。

責任編輯:gt

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 華為
    +關(guān)注

    關(guān)注

    216

    文章

    34819

    瀏覽量

    254173
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    32992

    瀏覽量

    272708
  • 大數(shù)據(jù)
    +關(guān)注

    關(guān)注

    64

    文章

    8931

    瀏覽量

    138658
收藏 0人收藏

    評論

    相關(guān)推薦

    DevEco Studio構(gòu)建分析工具Build Analyzer 原生鴻蒙應(yīng)用開發(fā)提速

    原生鴻蒙應(yīng)用開發(fā)過程中,隨著項目復雜度的增加,開發(fā)者花費在構(gòu)建上的時間越來越長,導致開發(fā)效率降低。為了幫助開發(fā)者解決構(gòu)建效率的問題,華為
    發(fā)表于 02-17 18:06

    云原生AI服務(wù)怎么樣

    云原生AI服務(wù),是指采用云原生的原則和技術(shù)來構(gòu)建、部署和管理人工智能應(yīng)用及工作負載的方法和模式。那么,云原生AI服務(wù)怎么樣呢?下面,AI部落小編帶您了解。
    的頭像 發(fā)表于 01-23 10:47 ?269次閱讀

    調(diào)理電路的噪聲余量計算如何計算

    調(diào)理電路的噪聲余量計算 請問各位,在數(shù)據(jù)采集系統(tǒng)中,2Msps要達到12bit分辨率,選用14bit的ADC。前端調(diào)理電路的噪聲理論余量如何計算。根據(jù)什么條件確定前端調(diào)理放大器的噪聲指標。。。比如調(diào)理電路的總噪聲不能夠超過多少?該如何
    發(fā)表于 01-21 07:55

    云原生LLMOps平臺作用

    云原生LLMOps平臺是一種基于云計算基礎(chǔ)設(shè)施和開發(fā)工具,專門用于構(gòu)建、部署和管理大型語言模型(LLM)全生命周期的平臺。以下,是對
    的頭像 發(fā)表于 01-06 10:21 ?276次閱讀

    如何選擇云原生機器學習平臺

    當今,云原生機器學習平臺因其彈性擴展、高效部署、低成本運營等優(yōu)勢,逐漸成為企業(yè)構(gòu)建和部署機器學習應(yīng)用的首選。然而,市場上的云原生機器學習平臺
    的頭像 發(fā)表于 12-25 11:54 ?293次閱讀

    構(gòu)建云原生機器學習平臺流程

    構(gòu)建云原生機器學習平臺是一個復雜而系統(tǒng)的過程,涉及數(shù)據(jù)收集、處理、特征提取、模型訓練、評估、部署和監(jiān)控等多個環(huán)節(jié)。
    的頭像 發(fā)表于 12-14 10:34 ?300次閱讀

    什么是云原生MLOps平臺

    云原生MLOps平臺,是指利用云計算的基礎(chǔ)設(shè)施和開發(fā)工具,來構(gòu)建、部署和管理機器學習模型的全生命周期的平臺。以下,是對
    的頭像 發(fā)表于 12-12 13:13 ?311次閱讀

    k8s微服務(wù)架構(gòu)就是云原生嗎?兩者是什么關(guān)系

    和安全性,使開發(fā)者能夠更輕松地構(gòu)建和部署現(xiàn)代化的應(yīng)用程序。然而,云原生不僅僅局限于Kubernetes或任何單一的技術(shù),它是一種方法論和最佳實踐,涵蓋了多個技術(shù)和理念,旨在充分利用云計算的優(yōu)勢來
    的頭像 發(fā)表于 11-25 09:39 ?334次閱讀

    云原生和非云原生哪個好?六大區(qū)別詳細對比

    云原生和非云原生各有優(yōu)劣,具體選擇取決于應(yīng)用場景。云原生利用云計算的優(yōu)勢,通過微服務(wù)、容器化和自動化運維等技術(shù),提高了應(yīng)用的可擴展性、更新速度和成本效益。非
    的頭像 發(fā)表于 09-13 09:53 ?573次閱讀

    基于Arm架構(gòu)的Azure虛擬機助力云原生應(yīng)用開發(fā)

    子系統(tǒng) (CSS) 所構(gòu)建的解決方案專為運行現(xiàn)代通用云工作負載而設(shè)計,并且通過優(yōu)化,云原生產(chǎn)品提供更高的效率和性能。
    的頭像 發(fā)表于 09-05 15:54 ?1966次閱讀

    京東云原生安全產(chǎn)品重磅發(fā)布

    “安全產(chǎn)品那么多,我怎么知道防住了?”“大家都說自己是云原生的,我看都是換湯不換藥”在與客戶溝通云原生安全方案的時候,經(jīng)常會遇到這樣的吐槽。越來越的客戶已經(jīng)開始了云原生化的技術(shù)架構(gòu)改造,也意識到
    的頭像 發(fā)表于 07-26 10:36 ?638次閱讀
    京東<b class='flag-5'>云原生</b>安全產(chǎn)品重磅發(fā)布

    從積木式到裝配式云原生安全

    從這兩個方面分別進行分析和解決。 新技術(shù)帶來新的安全風險 云原生的概念定義本身就比較抽象,從誕生到現(xiàn)在也經(jīng)歷了多次變化。2018年CNCF對云原生的概念進行了重定義:云原生技術(shù)有利于各組織在公有云、私有云和混合云等新型動態(tài)環(huán)境中
    的頭像 發(fā)表于 07-26 10:35 ?432次閱讀
    從積木式到裝配式<b class='flag-5'>云原生</b>安全

    基于DPU與SmartNic的云原生SDN解決方案

    隨著云計算,大數(shù)據(jù)和人工智能等技術(shù)的蓬勃發(fā)展,數(shù)據(jù)中心面臨著前所未有的數(shù)據(jù)洪流和計算壓力,這對SDN提出了更高的性能和效率要求。自云原生概念被提出以來,Kubernetes
    的頭像 發(fā)表于 07-22 11:44 ?923次閱讀
    基于DPU與SmartNic的<b class='flag-5'>云原生</b>SDN解決方案

    首批認證!拓維信息梧桐云原生平臺獲鯤鵬原生開發(fā)技術(shù)認證

    7月10日,拓維信息梧桐云原生平臺V3.0獲得華為鯤鵬原生開發(fā)技術(shù)首批認證。作為華為鯤鵬戰(zhàn)略合作伙伴,拓維信息以28年行業(yè)數(shù)字化經(jīng)驗和持續(xù)技術(shù)創(chuàng)新能力,攜手
    的頭像 發(fā)表于 07-19 08:15 ?590次閱讀
    首批認證!拓維信息梧桐<b class='flag-5'>云原生平臺</b>獲鯤鵬<b class='flag-5'>原生</b>開發(fā)技術(shù)認證

    賦能產(chǎn)業(yè)互聯(lián)網(wǎng),高通量計算讓世界更高效!

    隨著互聯(lián)網(wǎng)技術(shù)的迅猛發(fā)展,計算機的主要應(yīng)用從以傳統(tǒng)的科學與工程計算為主逐步演變?yōu)橐詳?shù)據(jù)處理核心,以傳統(tǒng)高性能計算機體系結(jié)構(gòu)核心技術(shù)的新型
    發(fā)表于 04-12 14:46 ?314次閱讀
    賦能產(chǎn)業(yè)互聯(lián)網(wǎng),高通<b class='flag-5'>量計算</b>讓世界更高效!

    電子發(fā)燒友

    中國電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會員交流學習
    • 獲取您個性化的科技前沿技術(shù)信息
    • 參加活動獲取豐厚的禮品