0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
电子发烧友
开通电子发烧友VIP会员 尊享10大特权
海量资料免费下载
精品直播免费看
优质内容免费畅学
课程9折专享价
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

TECS OpenStack資源池主機磁盤分區(qū)使用率過高的問題處理

中興文檔 ? 來源:中興文檔 ? 2025-03-21 09:47 ? 次閱讀

故障現(xiàn)象

某運營商TECS資源池上報“主機磁盤分區(qū)使用率過高”的告警,如下圖所示。

ff6b6cc2-04a1-11f0-9310-92fbcf53809c.png

故障分析

查看“主機磁盤分區(qū)使用率過高”告警詳情,通過處理當前告警的節(jié)點和對應(yīng)的磁盤分區(qū)能夠快速的處理和恢復(fù)告警。

告警處理完成后需要進一步排查分區(qū)增長的原因,有如下4種情況:

空間分配不足,規(guī)劃的分區(qū)空間不滿足現(xiàn)場集群和規(guī)模的要求。

出現(xiàn)大量crash和異常debug日志短時間沖擊磁盤分區(qū),可能是人為或者進程死循環(huán)導致。

日志文件或者定期輪詢文件未生效,導致歷史文件超限。

后端存儲異?;蛘吆蠖舜鎯?fù)用,導致磁盤使用率過高。

具體分析過程如下:

1. 根據(jù)告警詳細信息,使用SSH方式登錄相應(yīng)節(jié)點。

2. 在異常節(jié)點中執(zhí)行df -h命令,檢查輸出和操作系統(tǒng)運行情況,查看是否有系統(tǒng)只讀不可寫等系統(tǒng)內(nèi)核崩潰情況,如下圖所示。

ff8feb24-04a1-11f0-9310-92fbcf53809c.png

3. 檢查/var目錄下是否有過大問題。通過在每級目錄中執(zhí)行du -sh * 命令,檢查文件大小,從而排查最大異常問題,按照經(jīng)驗var下異常大小文件一般是/var/log下的日志,如下圖所示。

ffb42dea-04a1-11f0-9310-92fbcf53809c.png

4. 檢查日志存儲文件大小,如下圖所示。

ffe4cac2-04a1-11f0-9310-92fbcf53809c.png

5. 根據(jù)檢查結(jié)果發(fā)現(xiàn),logrotate機制未生效,日志文件未按照設(shè)定參數(shù)被壓縮,轉(zhuǎn)儲不成功,導致日志文件過大,占用磁盤空間。

故障處理

1. 執(zhí)行如下命令,清理磁盤。

a. 執(zhí)行> /var/lib/logrotate/logrotate.status命令,清空轉(zhuǎn)儲記錄。

b. 執(zhí)行l(wèi)ogrotate -d /etc/logrotate.conf命令,手動進行日志轉(zhuǎn)儲。

c. 執(zhí)行echo > /var/log/tecs/access/neutron/neutron-api.log命令,寫入空,覆蓋到日志文件內(nèi),如下圖所示。

0014aecc-04a2-11f0-9310-92fbcf53809c.png

2. 清理完成后重新檢查文件大小和磁盤占用情況,問題解決。

3. 總結(jié):對于磁盤分區(qū)使用率高問題,如果使用率達到100%就會導致節(jié)點不可用,系統(tǒng)自動備份失敗,數(shù)據(jù)庫定時備份失敗,無法登錄root用戶,等相關(guān)問題,存在很大的隱患,發(fā)現(xiàn)問題需要盡快定位對象主機上磁盤占用高的文件,進行處理。

本次是由于logrotate機制未生效,日志文件未按照設(shè)定參數(shù)被壓縮、轉(zhuǎn)儲,從而使日志文件不停增大,占用全部磁盤空間導致。

清理文件,觸發(fā)轉(zhuǎn)儲服務(wù)后,磁盤占用恢復(fù)正常。

建議定期檢查系統(tǒng)磁盤空間占用,預(yù)防此類事件發(fā)生。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 主機
    +關(guān)注

    關(guān)注

    0

    文章

    1029

    瀏覽量

    35724
  • 磁盤
    +關(guān)注

    關(guān)注

    1

    文章

    386

    瀏覽量

    25554
  • 命令
    +關(guān)注

    關(guān)注

    5

    文章

    719

    瀏覽量

    22627

原文標題:TECS OpenStack-資源池主機磁盤分區(qū)使用率過高的問題處理

文章出處:【微信號:ztedoc,微信公眾號:中興文檔】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 0人收藏

    評論

    相關(guān)推薦

    【雨林木風系統(tǒng)下載教程】利用XP系統(tǒng)磁盤分區(qū)來提升讀寫...

    XP中,利用圖形界面和人性化的操作方式,可對硬盤進行更加高效靈活的分區(qū)操作。不僅如此,借用電腦常用軟件下載的Windows XP強大的磁盤分區(qū)管理功能,還可增強磁盤分區(qū)的合理使用,并有效提升
    發(fā)表于 07-19 10:44

    linux的三種磁盤分區(qū)

    硬盤分區(qū)有三種,主磁盤分區(qū)(83)、擴展磁盤分區(qū)(5)、邏輯分區(qū)(包括swap交換分區(qū)82)。一個硬盤主
    發(fā)表于 07-12 06:56

    Linux系統(tǒng)教程之磁盤分區(qū)和LVM系統(tǒng)的詳細資料概述

    本文檔的主要內(nèi)容詳細介紹的是Linux系統(tǒng)教程之磁盤分區(qū)和LVM系統(tǒng)的詳細資料概述主要內(nèi)容包括了:1.磁盤相關(guān)概念2.磁盤分區(qū)工具3.創(chuàng)建 LVM 系統(tǒng)4.維護 LVM 系統(tǒng)
    發(fā)表于 10-30 16:11 ?14次下載
    Linux系統(tǒng)教程之<b class='flag-5'>磁盤分區(qū)</b>和LVM系統(tǒng)的詳細資料概述

    Windows 10 2004版或解決CPU和磁盤使用率過高的問題

    相信不少人在等待Windows 10的重要更新版本,事實上微軟也在努力推進,其會在新系統(tǒng)中加入一種新的算法,該算法使整體系統(tǒng)性能有了相當大的提升,特別是在CPU和磁盤使用率方面讓系統(tǒng)的運轉(zhuǎn)更加高效。
    的頭像 發(fā)表于 01-06 08:49 ?3189次閱讀

    微軟Windows 10研究新的方法管理現(xiàn)代磁盤分區(qū)

    如果要刪除舊磁盤并創(chuàng)建新分區(qū)或擴展特定磁盤的空間,則需要依賴Windows 10的磁盤管理工具。在Windows 10上管理磁盤分區(qū)的最簡單
    的頭像 發(fā)表于 03-19 15:06 ?2223次閱讀

    微軟Win10搜索磁盤和CPU使用率過高的問題修復(fù)

    Windows 10 20H1更新將于今年4月份發(fā)布,其中包含針對Windows搜索索引器導致的磁盤和CPU使用率過高的修復(fù)程序。今天,微軟確認正在開發(fā)另一個Windows 10更新,其中將包括Windows Search更多更
    的頭像 發(fā)表于 03-26 14:39 ?3584次閱讀

    cpu使用率過高怎么解決_cpu使用率過高是什么原因

    本文主要闡述了cpu使用率過高的原因及解決方法。
    發(fā)表于 04-29 09:34 ?1786次閱讀

    預(yù)裝Win7系統(tǒng)劃分更多的磁盤分區(qū)的方法

      硬盤分區(qū)有三種:主磁盤分區(qū)、擴展磁盤分區(qū)、邏輯分區(qū)。一個硬盤主分區(qū)至少有1個,最多4個,擴展分區(qū)
    發(fā)表于 07-08 10:50 ?0次下載
    預(yù)裝Win7系統(tǒng)劃分更多的<b class='flag-5'>磁盤分區(qū)</b>的方法

    獲取磁盤分區(qū)UUID的方法介紹

    UUID(通用唯一標識符,Universally Unique Identifiers)是磁盤分區(qū)的屬性,在管理具有數(shù)百個驅(qū)動器的服務(wù)器時至關(guān)重要。
    的頭像 發(fā)表于 01-31 17:45 ?1.3w次閱讀
    獲取<b class='flag-5'>磁盤分區(qū)</b>UUID的方法介紹

    TECS資源池上報網(wǎng)絡(luò)流程異常告警的問題處理

    資源TECS上報網(wǎng)絡(luò)流程異常告警,告警單次持續(xù)15秒-4分鐘之間。
    的頭像 發(fā)表于 06-07 09:41 ?1138次閱讀
    <b class='flag-5'>TECS</b><b class='flag-5'>資源</b>池上報網(wǎng)絡(luò)流程異常告警的問題<b class='flag-5'>處理</b>

    linux系統(tǒng)如何進行磁盤分區(qū)?

    linux系統(tǒng)如何進行磁盤分區(qū)? 磁盤分區(qū)是在Linux系統(tǒng)中進行硬盤劃分的一種方法,它可以將一個物理硬盤劃分為多個邏輯分區(qū),每個分區(qū)可獨立使用,使得儲存數(shù)據(jù)更加有序和靈活。 1. 為
    的頭像 發(fā)表于 12-19 11:35 ?1300次閱讀

    磁盤分區(qū)工具parted的使用方法

    傳統(tǒng)的MBR分區(qū)表格式,僅支持最大四個主分區(qū),而且不可以格式化2TB以上的磁盤,因此,大磁盤更適合使用parted工具進行GPT的分區(qū)格式。
    的頭像 發(fā)表于 03-03 09:39 ?461次閱讀

    TECS OpenStack資源虛機殘留導致網(wǎng)元異常的問題處理

    某運營商TECS資源的一臺主機內(nèi)存故障,進行關(guān)機、內(nèi)存更換操作,虛機自動遷移到其他主機上,同時做了其他虛擬機的手動遷移操作。后續(xù)在
    的頭像 發(fā)表于 03-03 09:42 ?235次閱讀
    <b class='flag-5'>TECS</b> <b class='flag-5'>OpenStack</b><b class='flag-5'>資源</b><b class='flag-5'>池</b>虛機殘留導致網(wǎng)元異常的問題<b class='flag-5'>處理</b>

    TECS OpenStack資源時間同步失敗的故障分析

    某運營商TECS OpenStack資源,在當前告警中顯示“時鐘同步失敗”,以10分鐘整數(shù)倍為間隔上報“時間同步失敗”告警,持續(xù)時間30秒-1分鐘不等。
    的頭像 發(fā)表于 03-03 10:09 ?275次閱讀
    <b class='flag-5'>TECS</b> <b class='flag-5'>OpenStack</b><b class='flag-5'>資源</b><b class='flag-5'>池</b>時間同步失敗的故障分析

    TECS OpenStack資源虛機寫磁盤時延高告警的問題處理

    某運營商TECS資源,在當前告警中顯示“虛機寫磁盤時延高告警”,如下圖所示。告警統(tǒng)計總體平均10分鐘左右自動恢復(fù)。
    的頭像 發(fā)表于 03-21 09:36 ?264次閱讀
    <b class='flag-5'>TECS</b> <b class='flag-5'>OpenStack</b><b class='flag-5'>資源</b><b class='flag-5'>池</b>虛機寫<b class='flag-5'>磁盤</b>時延高告警的問題<b class='flag-5'>處理</b>

    電子發(fā)燒友

    中國電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會員交流學習
    • 獲取您個性化的科技前沿技術(shù)信息
    • 參加活動獲取豐厚的禮品