0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
电子发烧友
开通电子发烧友VIP会员 尊享10大特权
海量资料免费下载
精品直播免费看
优质内容免费畅学
课程9折专享价
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

工具平臺(tái)對(duì)MLOps技術(shù)實(shí)踐的支持

jf_9aVl32Dp ? 來(lái)源:Arm軟件開(kāi)發(fā)者 ? 作者:Arm軟件開(kāi)發(fā)者 ? 2022-10-26 10:20 ? 次閱讀

在【AI工程】02-AI工程(AI Engineering)面面觀中,提到Gartner把AI工程化作為未來(lái)重要戰(zhàn)略技術(shù)趨勢(shì),Gartner認(rèn)為AI工程主要由DataOps、MLOps和DevOps三部分核心技術(shù)組成,其目標(biāo)是通過(guò)跨職能協(xié)作、自動(dòng)化、快速反饋等方法,來(lái)縮短數(shù)據(jù)分析、機(jī)器學(xué)習(xí)和應(yīng)用部署上線的周期,從而讓AI模型快速、持續(xù)地提供業(yè)務(wù)價(jià)值。開(kāi)發(fā)者基于傳統(tǒng)的工具平臺(tái)很難實(shí)現(xiàn)MLOps等AI工程領(lǐng)域的實(shí)踐,需要新的工具來(lái)完成對(duì)MLOps等技術(shù)實(shí)踐的支持。

26041920-5477-11ed-a3b6-dac502259ad0.jpg

Kubeflow是一個(gè)基于K8S的機(jī)器學(xué)習(xí)平臺(tái),為開(kāi)發(fā)者提供了從實(shí)驗(yàn)(Notebook)、訓(xùn)練(MLOps流水線)、調(diào)優(yōu)以及部署、監(jiān)控的端到端能力,也是當(dāng)前排名第一的開(kāi)源MlOps工具。

262e3cb4-5477-11ed-a3b6-dac502259ad0.jpg

Kubeflow本身也是由一系列的開(kāi)源工具組成,從它的架構(gòu)圖中不難看出,Kubeflow主要提供三部分能力:

ML工具:主流開(kāi)源框架支持,如Tensorflow,PyTorch等。

Kubeflow應(yīng)用及腳手架工具:

(1). jupyter Notebook:開(kāi)箱即用的Notebook,支持多AI框架。

(2). 分布式訓(xùn)練:支持Tensorflow、PyTorch等多框架的分布式訓(xùn)練(參數(shù)服務(wù)器形式)。

(3). 流水線管理:基于Argo的工作流管理,提供訓(xùn)練流水線管理能力。

(4). 鏡像構(gòu)建:將訓(xùn)練、notebook代碼打包,以支持訓(xùn)練及部署任務(wù)。

(5). Serving部署:支持多AI框架的部署。

3.周邊配套:支持三方部署、監(jiān)控等能力。

Canonical公司(Ubuntude發(fā)行商)在Kubeflow的基礎(chǔ)上,包裝了Charmed Kubeflow項(xiàng)目,提供構(gòu)成KubeFlow最新版本的30多個(gè)應(yīng)用程序和服務(wù),并且讓Kubeflow的部署更快,更簡(jiǎn)單。

最新的1.6版本中,Charmed Kubeflow的Notebook原生支持了MindSpore,下面我們來(lái)看下如何基于Charmed Kubeflow 快速啟動(dòng)支持MindSpore的Notebook。

安裝Charmed Kubeflow

要安裝Kubeflow,首先得準(zhǔn)備好K8S集群,然后通過(guò)juju這個(gè)運(yùn)維管理工具安裝Charmed Kubeflow。

通過(guò)MicroK8S工具部署K8S集群

Canonical提供了一個(gè)和Minikube類(lèi)似的工具M(jìn)icroK8S,通過(guò)Snap工具可以快速完成其安裝。

在Ubuntu 20.04系統(tǒng)上執(zhí)行如下命令:

sudo snap install microk8s --classic --channel=1.22/stable

安裝完成后,為了方便使用,可以將當(dāng)前的用戶(hù)加入到microk8s的用戶(hù)組中。

sudo usermod -a -G microk8s $USER
newgrp microk8s

確認(rèn)用戶(hù)可以訪問(wèn)kubectl的配置文件。

sudo chown -f -R $USER ~/.kube

MicroK8s在安裝的時(shí)候就會(huì)啟動(dòng),為了運(yùn)行kubeflow,我們還需要一些額外的能力,比如DNS(服務(wù)發(fā)現(xiàn))、存儲(chǔ)、ingress(負(fù)載均衡),MicroK8S可以以插件的形式快速的添加這些能力

microk8s enable dns storage ingress metallb:10.64.140.43-10.64.140.49

整個(gè)安裝需要花費(fèi)一點(diǎn)時(shí)間,通過(guò)microk8s status --wait-ready可以確認(rèn)MicroK8S是否安裝成功。

microk8s is running
high-availability: no
  datastore master nodes: 127.0.0.1:19001
  datastore standby nodes: none
……

MicroK8S提供了kubectl命令,但是每次都需要在命令行輸入microk8s kubectl,可以考慮增加一個(gè)別名alias kubectl='microk8s kubectl'方便使用,其次,如果集群的配置信息沒(méi)有寫(xiě)到~/.kube/中,可以通過(guò)microk8s config > ~/.kube/config完成覆寫(xiě)。

通過(guò)juju安裝Charmed Kubeflow

Charmed Operator Lifecycle Manager (OLM)是一個(gè)應(yīng)用(以特殊格式封裝,稱(chēng)為Charm Operator)編排的平臺(tái),它可以方便的管理混合云中部署在虛機(jī)、K8S集群、裸機(jī)上的應(yīng)用,對(duì)應(yīng)用進(jìn)行安裝、配置、維護(hù)及更新。Canonical提供了這樣的OLM框架,名為Juju,同時(shí)也提供了juju這個(gè)同名的命令行工具。

首先,我們使用sudo snap install juju --classic命令安裝juju。其次,通過(guò)juju bootstrap microk8s在MicroK8S部署好的集群上安裝juju的controller,作為juju在集群中的代理,管理Kubeflow應(yīng)用。最后為juju在集群上添加kubeflow的命名空間juju add-model kubeflow。

接下來(lái),通過(guò)juju deploy kubeflow-lite --trust命令即可完成kubeflow的安裝,通過(guò)watch -c juju status --color可以看到kubeflow組件準(zhǔn)備狀態(tài)。

2692db10-5477-11ed-a3b6-dac502259ad0.jpg

最后,通過(guò)juju refresh jupyter-ui --channel=latest/edge命令確保jupyter-ui更新到最新的版本,包含MindSpore的Notebook鏡像。

配置kubeflow

Kubeflow安裝完成后需要做下簡(jiǎn)單的配置才能訪問(wèn)。首先配置訪問(wèn)的地址:

juju config dex-auth public-url=http://10.64.140.43.nip.io
juju config oidc-gatekeeper public-url=http://10.64.140.43.nip.io

然后配置訪問(wèn)的用戶(hù)名和密碼:

juju config dex-auth static-username=admin
juju config dex-auth static-password=ucantseeme

接下來(lái)在瀏覽器中輸入http://10.64.140.43.nip.io,以及剛設(shè)置的用戶(hù)密碼,就可以看到Kubeflow完整的Dashboard了。

26c0c66a-5477-11ed-a3b6-dac502259ad0.jpg

運(yùn)行支持MindSpore的Notebook

在Kubeflow上運(yùn)行Notebook非常簡(jiǎn)單。在Notebook tab選擇創(chuàng)建notebook,輸入notebook名稱(chēng)MindSpore,鏡像選擇jupyterlab,在列表中使用mindspore/jupyter-mindspore這個(gè)鏡像,然后分配合適的CPU和內(nèi)容資源,點(diǎn)擊創(chuàng)建即可。

26e89b22-5477-11ed-a3b6-dac502259ad0.jpg

在Notebook界面很快就可以看到創(chuàng)建完成的提示。

27227c0c-5477-11ed-a3b6-dac502259ad0.png

點(diǎn)擊Connect,我們就可以在另一個(gè)瀏覽器tab頁(yè)打開(kāi)notebook了。這里我們可以使用MindSpore官網(wǎng)現(xiàn)成的notebook,通過(guò)notebook頁(yè)面將這個(gè)手寫(xiě)數(shù)字識(shí)別的notebook上傳上去。

點(diǎn)擊執(zhí)行,就可以看到這個(gè)notebook直接運(yùn)行起來(lái)了,不用額外的去安裝MindSpore以及Vision套件。

27635b46-5477-11ed-a3b6-dac502259ad0.jpg

總結(jié)

這是MindSpore和Charmed Kubeflow集成的第一步,后續(xù)我們還將持續(xù)的把MindSpore更多能力集成到Charmed Kubeflow中,方便開(kāi)發(fā)者能在MlOps平臺(tái)上更方便的使用MindSpore。

審核編輯:彭靜
聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    31892

    瀏覽量

    270708
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8455

    瀏覽量

    133182
  • 數(shù)據(jù)分析
    +關(guān)注

    關(guān)注

    2

    文章

    1462

    瀏覽量

    34205

原文標(biāo)題:【AI工程】08-MLOps工具-在Charmed Kubeflow上運(yùn)行MindSpore

文章出處:【微信號(hào):Arm軟件開(kāi)發(fā)者,微信公眾號(hào):Arm軟件開(kāi)發(fā)者】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 0人收藏

    評(píng)論

    相關(guān)推薦

    實(shí)時(shí)在線的技術(shù)支持和交流活動(dòng)的IM工具

    實(shí)時(shí)在線的技術(shù)支持和交流活動(dòng)的IM工具中電網(wǎng)“談芯Q”(TCQ)是一款致力于為廣大工程師用戶(hù)提供實(shí)時(shí)在線的技術(shù)支持和交流活動(dòng)的IM工具。下載并安裝TCQ后,您可以隨時(shí)隨地與在線
    發(fā)表于 02-24 10:18

    云上拍客梨視頻 基于阿里云的技術(shù)實(shí)踐分享

    摘要: 梨視頻大部分的業(yè)務(wù)都選擇了阿里云,其中一個(gè)主要原因是阿里云提供基于釘釘群構(gòu)建的24貼身技術(shù)支持,劉雋表示,這種服務(wù)模式可以更充分、高效的對(duì)接需求,快速得到反饋,這也讓梨視頻的同學(xué)有信心去嘗試
    發(fā)表于 06-28 16:13

    用Intel Analytics Zoo/BigDL為客服平臺(tái)添加AI的實(shí)踐(一)

    ,我們將介紹為客服平臺(tái)添加文本分類(lèi)模塊的大致流程及實(shí)踐經(jīng)驗(yàn)。 背景 在如今商業(yè)高度發(fā)達(dá)的社會(huì),客戶(hù)支持服務(wù)平臺(tái)已被廣泛使用在售前和售后為客戶(hù)提供技術(shù)
    的頭像 發(fā)表于 10-17 10:30 ?4740次閱讀

    數(shù)據(jù)科學(xué)平臺(tái)cnvrg.io攜手NetApp用深度學(xué)習(xí)改變MLOps數(shù)據(jù)集緩存

    中國(guó)存儲(chǔ)網(wǎng)消息,近日,數(shù)據(jù)科學(xué)平臺(tái)cnvrg.io簡(jiǎn)化了模型管理并將MLOps引入行業(yè),它宣布與NetApp公司。建立合作關(guān)系,這是第一個(gè)利用cnvrg.io數(shù)據(jù)集緩存工具工具,該
    發(fā)表于 07-20 09:09 ?2112次閱讀

    COSMOPlat在開(kāi)源技術(shù)方向的探索和實(shí)踐

    在2020工業(yè)互聯(lián)網(wǎng)大會(huì)工業(yè)互聯(lián)網(wǎng)新技術(shù)主題論壇上,海爾卡奧斯物聯(lián)生態(tài)科技有限公司云平臺(tái)架構(gòu)師劉安發(fā)表題為《COSMOPlat在開(kāi)源技術(shù)方向的探索和實(shí)踐》的演講,分享COSMOPlat
    的頭像 發(fā)表于 11-02 10:54 ?2111次閱讀

    基于AUTOSAR技術(shù)的SOA軟件平臺(tái)實(shí)踐的簡(jiǎn)析

    (Driver Monitoring System)場(chǎng)景應(yīng)用和娛樂(lè)域的氛圍燈的場(chǎng)景應(yīng)用。雙方聯(lián)合打造的SOA軟件平臺(tái),可以更好的賦能領(lǐng)域內(nèi)的生態(tài)伙伴開(kāi)展SOA軟件開(kāi)發(fā)實(shí)踐支持產(chǎn)品的量產(chǎn)落地。 DMS應(yīng)用
    發(fā)表于 11-16 11:48 ?607次閱讀
    基于AUTOSAR<b class='flag-5'>技術(shù)</b>的SOA軟件<b class='flag-5'>平臺(tái)</b><b class='flag-5'>實(shí)踐</b>的簡(jiǎn)析

    星環(huán)科技推企業(yè)級(jí)AI能力運(yùn)營(yíng)平臺(tái)Sophon MLOps 助推AI模型落地

    為解決AI落地難的問(wèn)題,星環(huán)科技的AI團(tuán)隊(duì)從用戶(hù)需求端出發(fā),傾力研發(fā)了一款基于云原生架構(gòu)的企業(yè)級(jí)AI能力運(yùn)營(yíng)平臺(tái)Sophon MLOps,助推AI模型落地。
    的頭像 發(fā)表于 05-12 17:17 ?2137次閱讀

    人工智能研發(fā)運(yùn)營(yíng)體系(MLOps)實(shí)踐指南

    制度規(guī)范的 建立、流程的打通、工具鏈的建設(shè)等諸多環(huán)節(jié)面臨困難。因此本指南 旨在成為組織落地 MLOps 并賦能業(yè)務(wù)的“口袋書(shū)”,圍繞機(jī)器學(xué)習(xí)全 生命周期,為模型的持續(xù)構(gòu)建、持續(xù)交付、持續(xù)運(yùn)營(yíng)等過(guò)程提供參考, 推進(jìn)組織的 MLOps
    發(fā)表于 03-30 16:49 ?0次下載

    RISC-V設(shè)計(jì)支持工具,支持RISC-V技術(shù)的基礎(chǔ)

    RISC-V設(shè)計(jì)支持工具,支持RISC-V技術(shù)的基礎(chǔ) ppt分享
    發(fā)表于 07-14 17:15 ?20次下載

    駕馭創(chuàng)造的力量: 生成式 AI 時(shí)代的 MLOps 演進(jìn)

    以下文章來(lái)源于谷歌云服務(wù),作者 Google Cloud 駕馭創(chuàng)造的力量: 生成式?AI?時(shí)代的?MLOps?演進(jìn)? MLOps 是一種將機(jī)器學(xué)習(xí)模型從實(shí)驗(yàn)室推向生產(chǎn)的系統(tǒng)方法,它能夠通過(guò)全面
    的頭像 發(fā)表于 12-21 18:05 ?381次閱讀

    基于分布式運(yùn)維管理平臺(tái)的智慧城市運(yùn)維實(shí)踐

    。這包括但不限于交通、能源、環(huán)境、醫(yī)療、教育等各個(gè)領(lǐng)域。分布式運(yùn)維管理平臺(tái)作為一種先進(jìn)的技術(shù)工具,通過(guò)集成大數(shù)據(jù)、云計(jì)算、物聯(lián)網(wǎng)等技術(shù),為智慧城市運(yùn)維提供了強(qiáng)大的
    的頭像 發(fā)表于 03-26 16:12 ?593次閱讀

    MLOps平臺(tái)優(yōu)點(diǎn)

    MLOps平臺(tái)在提升機(jī)器學(xué)習(xí)模型的開(kāi)發(fā)與部署效率、可擴(kuò)展性與靈活性、透明度與可重復(fù)性以及降低風(fēng)險(xiǎn)和持續(xù)改進(jìn)方面具有顯著優(yōu)點(diǎn)。
    的頭像 發(fā)表于 11-06 10:10 ?217次閱讀

    什么是云原生MLOps平臺(tái)

    云原生MLOps平臺(tái),是指利用云計(jì)算的基礎(chǔ)設(shè)施和開(kāi)發(fā)工具,來(lái)構(gòu)建、部署和管理機(jī)器學(xué)習(xí)模型的全生命周期的平臺(tái)。以下,是對(duì)云原生MLOps
    的頭像 發(fā)表于 12-12 13:13 ?202次閱讀

    MLOps平臺(tái)的發(fā)展方向

    MLOps平臺(tái)作為機(jī)器學(xué)習(xí)開(kāi)發(fā)運(yùn)維一體化的重要工具,其發(fā)展方向?qū)⑸羁逃绊懭斯ぶ悄?b class='flag-5'>技術(shù)的普及和應(yīng)用。下面,是對(duì)MLOps
    的頭像 發(fā)表于 12-31 11:51 ?150次閱讀

    MLOps托管服務(wù)怎么樣

    MLOps托管服務(wù)以其卓越的性能和顯著的優(yōu)勢(shì),成為企業(yè)加速機(jī)器學(xué)習(xí)應(yīng)用落地的理想選擇。以下,是對(duì)MLOps托管服務(wù)優(yōu)勢(shì)的介紹,由AI部落小編整理。
    的頭像 發(fā)表于 01-22 10:21 ?106次閱讀

    電子發(fā)燒友

    中國(guó)電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會(huì)員交流學(xué)習(xí)
    • 獲取您個(gè)性化的科技前沿技術(shù)信息
    • 參加活動(dòng)獲取豐厚的禮品