0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Slurm作業(yè)管理系統(tǒng)常用命令和教程

Cloudam云端 ? 來源:Cloudam云端 ? 作者:Cloudam云端 ? 2022-11-15 15:10 ? 次閱讀

Slurm ( Simple Linux Utility for Resource Management )是開源的、具有容錯性和高度可擴展大型和小型 Linux集群資源管理和作業(yè)調(diào)度系統(tǒng)。超級計算系統(tǒng)可利用 Slurm 進(jìn)行資源和作業(yè)管理,以避免相互干擾,提高運行效率。所有需運行的作業(yè)無論是用于程序調(diào)試還是業(yè)務(wù)計算均必須通過交互式并行 srun、批處理式 sbatch 或分配式 salloc 等命令提交,提交后可以利用相關(guān)命令查詢作業(yè)狀態(tài)等。

同時北鯤云超算平臺也是使用的Slurm作業(yè)管理系統(tǒng),熟悉slurm作業(yè)管理系統(tǒng)的同學(xué)可以快速上手北鯤云進(jìn)行計算,不熟悉的也沒關(guān)系,一是可以學(xué),我們有完整的教程以及技術(shù)支持服務(wù),另外就是平臺還提供模板提交方式,無需it基礎(chǔ)也可以快速進(jìn)行計算。直接按照模板提示提交作業(yè)即可。多種軟件覆蓋多個行業(yè),歡迎lai'shi'yi's

一. 常用命令?

sinfo       #查看分區(qū)狀態(tài)squeue      #查看隊列中的作業(yè)scontrol    #查看作業(yè)詳細(xì)信息scancel     #取消已經(jīng)提交的作業(yè)sbatch      #批處理式提交作業(yè)salloc      #分配式運行作業(yè)

1. 查看分區(qū)狀態(tài)?

sinfo

CPU分區(qū)命名規(guī)則為c-核心數(shù)-每核心內(nèi)存大小,如c-8-4:表示單節(jié)點規(guī)格為8核,每核心有4G內(nèi)存,即節(jié)點規(guī)格為8核32G。

GPU分區(qū)命名規(guī)則為g-卡號-每節(jié)點卡數(shù),如g-v100-2:表示有兩張顯卡型號為tesla v100的gpu節(jié)點。

pYYBAGNzO1CAVeJpAAC06YCVFHw173.png

2. 查看作業(yè)隊列?

squeue

JOBID:作業(yè)號。

ST:狀態(tài) (R:運行中;CF:配置中;PD:排隊中)。

poYBAGNzO1CAEfidAAA3jM5usFs213.png

3. 查看所有作業(yè)詳細(xì)信息?

scontrol show jobs

pYYBAGNzO1GAHir4AAEXEvLM2gQ216.png

4. 取消作業(yè)號為20的作業(yè)?

scancel 20

二. 提交作業(yè)的方式?

1. 使用sbatch批處理模式提交作業(yè)?

sbatch命令可以提交任務(wù)至一個或多個計算節(jié)點,實現(xiàn)并行計算。

sbatch命令的一些常用選項

參數(shù) 功能
-N 申請的節(jié)點數(shù)量
-p 指定計算節(jié)點規(guī)格,使用sinfo查看所支持的規(guī)格
-n 指定任務(wù)數(shù),即并行程序運行多少個進(jìn)程
-c 每進(jìn)程使用的cpu核心數(shù)

參考運行程序:demo.sh

#!/bin/bashsleep 6000

提交示例:

使用2個4核心節(jié)點啟動8個并行任務(wù)。

sbatch -N 2 -p c-4-1 -n 8 -c 1 demo.sh

1個4核心節(jié)點啟動4個并行任務(wù)。

sbatch -N 1 -p c-4-1 -n 4 -c 1 demo.sh

1個4核心節(jié)點啟動4個并行任務(wù)。

sbatch -p c-4-1 -n 4 demo.sh

1個4核心節(jié)點啟動1個并行任務(wù), 該任務(wù)使用4個cpu核心。

sbatch -p c-4-1 -n 1 -c 4 demo.sh

2個4核心節(jié)點啟動2個并行任務(wù), 每個任務(wù)使用4個cpu核心。

sbatch -p c-4-1 -n 2 -c 4 demo.sh

2. 使用salloc分配模式提交作業(yè)?

salloc命令可以用來分配節(jié)點,用戶可以在獲取分配的計算節(jié)點后,ssh進(jìn)入直接運行相關(guān)計算程序,主要用來調(diào)式程序執(zhí)行。

使用步驟(案例):

Step1. salloc申請計算節(jié)點;

salloc -N 1 -p c-8-2 &

Step2. ssh登錄到分配的計算節(jié)點;

ssh c-8-2-worker0001

Step3. 調(diào)試或運行程序;

./demo.sh

Step4. 結(jié)束程序運行后釋放分配的節(jié)點;

scancel 17

poYBAGNzO1KACrrjAACXyNsNLEg493.png

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • Linux
    +關(guān)注

    關(guān)注

    87

    文章

    11342

    瀏覽量

    210216
  • 命令
    +關(guān)注

    關(guān)注

    5

    文章

    696

    瀏覽量

    22084
  • 管理系統(tǒng)
    +關(guān)注

    關(guān)注

    1

    文章

    2573

    瀏覽量

    36054
收藏 人收藏

    評論

    相關(guān)推薦

    windowsxp常用命令

    windowsxp常用命令   winver---------檢查windows版本 wmimgmt.msc----打開windows管理體系結(jié)構(gòu)(wmi) wupdmgr-------
    發(fā)表于 01-10 09:05 ?1291次閱讀

    Ubuntu常用命令大全

    Ubuntu常用命令大全,包括常用管理目錄,系統(tǒng)命令,硬盤相關(guān),內(nèi)存相關(guān),查看進(jìn)程等命令
    發(fā)表于 01-06 11:16 ?0次下載

    DOS常用命令寶典

    DOS常用命令寶典,感興趣的小伙伴們可以瞧一瞧。
    發(fā)表于 11-10 18:24 ?0次下載

    04-shell的常用命令匯總與vim

    shell的常用命令匯總
    發(fā)表于 12-17 16:04 ?0次下載

    vim常用命令

    vim常用命令
    發(fā)表于 01-08 15:59 ?3次下載

    redis常用命令總結(jié)

    本文是對redis常用命令總結(jié)。
    發(fā)表于 02-09 11:25 ?1626次閱讀

    SQL Plus的常用命令與用戶管理實驗說明

    本文檔的主要內(nèi)容詳細(xì)介紹的是SQL Plus的常用命令與用戶管理實驗說明。
    發(fā)表于 10-30 17:19 ?8次下載

    linux常用命令手冊

    linux常用命令手冊免費下載。
    發(fā)表于 06-01 14:59 ?68次下載

    Memcache系統(tǒng)常用命令講解

    Memcache系統(tǒng)常用命令講解(無線電源技術(shù)商業(yè)計劃書)-該文檔為Memcache系統(tǒng)常用命令講解文檔,是一份還算不錯的參考文檔,感興趣的可以下載看看,,,,,,,,,,,,,,,,
    發(fā)表于 09-28 11:27 ?5次下載
    Memcache<b class='flag-5'>系統(tǒng)</b><b class='flag-5'>常用命令</b>講解

    linux常用命令大全

    linux常用命令大全,一些常用命令都可以找到
    發(fā)表于 03-03 09:20 ?0次下載

    DOS系統(tǒng)常用命令

    介紹了DOS系統(tǒng)常用命令。
    發(fā)表于 03-21 14:59 ?0次下載

    Linux常用命令

    Linux常用命令
    的頭像 發(fā)表于 01-12 11:19 ?1185次閱讀

    Linux常用命令手冊分享

    linux常用命令合集
    發(fā)表于 04-26 11:46 ?1次下載

    linux常用命令及用法

    Linux是一種開源的操作系統(tǒng),它以穩(wěn)定、高效和安全的特點受到廣大用戶的喜愛。掌握Linux的常用命令及其用法對于操作系統(tǒng)管理和開發(fā)都至關(guān)重要。本文將詳盡、詳實、細(xì)致地介紹Linux
    的頭像 發(fā)表于 11-17 09:47 ?707次閱讀

    詳解kubectl常用命令

    詳解kubectl常用命令
    的頭像 發(fā)表于 11-05 15:39 ?332次閱讀
    詳解kubectl<b class='flag-5'>常用命令</b>