計(jì)算機(jī)性能是一門令人激動(dòng)的,富于變化同時(shí)又充滿挑戰(zhàn)的領(lǐng)域。
系統(tǒng)性能是對(duì)整個(gè)計(jì)算機(jī)系統(tǒng)的性能的研究,包括主要硬件組件和軟件組件。所有數(shù)據(jù)路徑上和從存儲(chǔ)設(shè)備到應(yīng)用軟件上所發(fā)生的事情都包括在內(nèi),因?yàn)檫@些都有可能影響性能。對(duì)于分布式系統(tǒng)來說,這意味著多臺(tái)服務(wù)器和多個(gè)應(yīng)用。如果你還沒有關(guān)于你的環(huán)境的一張示意圖,用來顯示數(shù)據(jù)的路徑,趕緊找一張或者自己畫一張。它可以幫助你理解所有組件的關(guān)系,并確保你不會(huì)只見樹木不見森林。
系統(tǒng)性能的典型目標(biāo)是通過減少延時(shí)和降低計(jì)算成本來改善終端用戶的體驗(yàn)。降低成本可以通過消除低效之處、提高系統(tǒng)吞吐量和進(jìn)行常規(guī)性能調(diào)優(yōu)來實(shí)現(xiàn)。
下面是系統(tǒng)性能的一些重要概念
延時(shí)
對(duì)于某些環(huán)境,延時(shí)是被唯一關(guān)注的性能焦點(diǎn)。而對(duì)于其他環(huán)境,它會(huì)是除了吞吐量以外,數(shù)一數(shù)二的分析要點(diǎn)。
作為延時(shí)的一個(gè)例子,圖 2.3 顯示了如 HTTP GET 請(qǐng)求的網(wǎng)絡(luò)傳輸,其響應(yīng)時(shí)間被分成連接延時(shí)和數(shù)據(jù)傳輸時(shí)間兩部分。
延時(shí)是操作執(zhí)行之前所花的等待時(shí)間。在這個(gè)例子里,操作是網(wǎng)絡(luò)服務(wù)的數(shù)據(jù)傳輸請(qǐng)求。在這個(gè)操作發(fā)生之前,系統(tǒng)必須等待建立網(wǎng)絡(luò)連接,這就是這個(gè)操作的延時(shí)。響應(yīng)時(shí)間包括了延時(shí)和操作時(shí)間。
因?yàn)檠訒r(shí)可以在不同點(diǎn)測(cè)量,所以通常會(huì)指明延時(shí)測(cè)量的對(duì)象。例如,網(wǎng)站的載入時(shí)間由三個(gè)從不同點(diǎn)測(cè)得的不同時(shí)間組成 :DNS 延時(shí)、TCP 連接延時(shí)和 TCP 數(shù)據(jù)傳輸時(shí)間。DNS 延時(shí)指的是整個(gè) DNS 操作的時(shí)間,TCP 連接延時(shí)僅僅指的是初始化時(shí)間(TCP 握手)。
由于延時(shí)是一個(gè)時(shí)間上的指標(biāo),因此可能有多種計(jì)算方法。性能問題可以用延時(shí)來進(jìn)行量化和評(píng)級(jí),因?yàn)槭怯孟嗤膯挝粊肀磉_(dá)的(時(shí)間)。通過考量所能減少或移除的延時(shí),預(yù)計(jì)的加速也可以被計(jì)算出來。這兩者不能用 IOPS 指標(biāo)很準(zhǔn)確地描述出來。
時(shí)間的量級(jí)和縮寫列在了表 2.1 中,可作為參考。
如果可能,其他的指標(biāo)也會(huì)轉(zhuǎn)化為延時(shí)或者時(shí)間,這樣就可以進(jìn)行比較了。如果必須在 100 個(gè)網(wǎng)絡(luò) I/O 和 50 個(gè)磁盤 I/O 之間做出選擇,怎樣才能知道哪個(gè)性能更好?這是一個(gè)復(fù)雜的選擇,因?yàn)槠渲邪撕芏嘁蛩?:網(wǎng)絡(luò)跳數(shù)、網(wǎng)絡(luò)丟包率和重傳率、I/O 的大小、隨機(jī)或順序的 I/O、磁盤類型,等等。但是如果你比較的是 100ms 的網(wǎng)絡(luò) I/O 延時(shí)和 50ms 的磁盤 I/O 延時(shí),那差別就很明顯了!
時(shí)間量級(jí)
我們可以對(duì)時(shí)間進(jìn)行量化的比較,同時(shí)最好對(duì)時(shí)間和各種來源的延時(shí)的合理預(yù)期有本能的認(rèn)識(shí)。系統(tǒng)各組件的操作的時(shí)間量級(jí)差別巨大,表 2.2 中提供的延時(shí)示例,從訪問 3.5GHz 的 CPU 寄存器的延時(shí)開始,闡釋了各種操作時(shí)間量級(jí)的差別。表中所示的是發(fā)生單次操作的時(shí)間均值,等比放大為一個(gè)假想的系統(tǒng),將 1 個(gè) CPU 周期的 0.3ns(十億分之一秒的三分之一 1)放大為現(xiàn)實(shí)生活中的 1 秒。
正如你所見,1 個(gè) CPU 周期的時(shí)間是很短暫的。0.5 米差不多是你的眼睛到這個(gè)頁面的距離,光線走過這段距離需要的時(shí)間大約是 1.7ns。在這段時(shí)間里,現(xiàn)代的 CPU 已經(jīng)執(zhí)行了 5 個(gè) CPU 周期,處理了若干個(gè)指令。
權(quán)衡
你應(yīng)該知道某些性能權(quán)衡關(guān)系。圖 2.4 展示的是好 / 快 / 便宜“擇其二”的權(quán)衡關(guān)系,右圖所示的是對(duì)應(yīng)于 IT 項(xiàng)目的術(shù)語。
許多 IT 項(xiàng)目選擇了及時(shí)和成本低,留下了性能問題在以后解決。當(dāng)早期的決定阻礙了性能提高的可能性時(shí),這樣的選擇會(huì)變得有問題,例如,選擇了非最優(yōu)的存儲(chǔ)架構(gòu),或者使用的編程語言或操作系統(tǒng)缺乏完善的性能分析工具。
一個(gè)常見的性能調(diào)優(yōu)的權(quán)衡是在CPU 與內(nèi)存之間,因?yàn)閮?nèi)存能用于緩存數(shù)據(jù)結(jié)果,降低 CPU 的使用率。在有著充足 CPU 資源的現(xiàn)代系統(tǒng)里,交換可以反向進(jìn)行 :CPU 可以壓縮數(shù)據(jù)來降低內(nèi)存的使用。
調(diào)優(yōu)的影響
性能調(diào)優(yōu)實(shí)施在越靠近工作執(zhí)行的地方效果最顯著。對(duì)于工作負(fù)載驅(qū)動(dòng)的應(yīng)用程序,這意味著調(diào)優(yōu)性能的地方就在應(yīng)用程序本身。表 2.3 展示了一個(gè)軟件棧的例子,說明了性能調(diào)優(yōu)的各種可能。
對(duì)應(yīng)用程序?qū)蛹?jí)進(jìn)行調(diào)優(yōu),可能通過消除或減少數(shù)據(jù)庫(kù)查詢獲得很大的性能提升(例如,20 倍)。在存儲(chǔ)設(shè)備層級(jí)進(jìn)行調(diào)優(yōu),可以精簡(jiǎn)或提高存儲(chǔ) I/O,但是性能提升的重要部分在更高層級(jí)的操作系統(tǒng)棧代碼,所以對(duì)存儲(chǔ)設(shè)備層級(jí)的調(diào)優(yōu)對(duì)應(yīng)用程序性能的提升有限,是百分比量級(jí)的(例如,20%)。
在應(yīng)用程序?qū)蛹?jí)尋求性能的巨大提升,還有一個(gè)理由。如今許多環(huán)境都致力于特性和功能的快速部署,按每周或每天將軟件的變更推入生產(chǎn)環(huán)境。因此,應(yīng)用程序的開發(fā)和測(cè)試傾向于關(guān)注正確性,在部署前留給性能測(cè)量和優(yōu)化的時(shí)間很少甚至沒有。之后當(dāng)性能成為問題時(shí),才會(huì)去做這些與性能相關(guān)的事情。
雖然發(fā)生在應(yīng)用程序?qū)蛹?jí)的調(diào)優(yōu)效果最顯著,但這個(gè)層級(jí)不一定是觀測(cè)效果最顯著的層級(jí)。數(shù)據(jù)庫(kù)查詢緩慢最好從其所花費(fèi)的 CPU 時(shí)間、文件系統(tǒng)和所執(zhí)行的磁盤 I/O 方面來考查。使用操作系統(tǒng)工具,這些都是可以觀測(cè)到的。
合適的層級(jí)
不同的公司和環(huán)境對(duì)性能有著不同的需求。你可能加入過這樣的公司,其分析標(biāo)準(zhǔn)要比你之前所見過的嚴(yán)格得多,甚至可能聽都沒聽過?;蛘呤沁@樣的公司,你覺得很基本的分析被認(rèn)為很高端甚至從未使用過(這是好消息 :事情簡(jiǎn)單輕松?。?/p>
這并不意味著某些公司做的是對(duì)的,某些做的是錯(cuò)的。這取決于性能技術(shù)投入的投資回報(bào)率(ROI)。擁有大型數(shù)據(jù)中心或大型云環(huán)境的組織可能會(huì)雇用一個(gè)性能工程師團(tuán)隊(duì)來分析所有的事情,包括內(nèi)核內(nèi)部和 CPU 性能計(jì)數(shù)器,并頻繁使用各種跟蹤工具。他們還可能對(duì)性能進(jìn)行正式建模,并對(duì)未來的增長(zhǎng)進(jìn)行準(zhǔn)確預(yù)測(cè)。對(duì)于每年在計(jì)算上有數(shù)百萬花費(fèi)的環(huán)境來說,雇用這樣一個(gè)性能團(tuán)隊(duì)是值得的,因?yàn)樗麄冞M(jìn)行的優(yōu)化就是投資回報(bào)。小型創(chuàng)業(yè)公司的計(jì)算開支不大,可能只進(jìn)行表面的檢查,利用第三方監(jiān)測(cè)方案來檢查性能和提供警報(bào)。
何時(shí)停止分析
做性能分析時(shí)的一個(gè)挑戰(zhàn)是如何知道何時(shí)停止。有這么多的工具,有這么多的東西要檢查!
當(dāng)我教性能課程時(shí)(最近我又開始教了),我給我的學(xué)生一個(gè)有三個(gè)原因的性能問題,我發(fā)現(xiàn)有些學(xué)生在找到一個(gè)原因后就停止了,有些則是兩個(gè),有些則是三個(gè)。有些學(xué)生則繼續(xù)努力,試圖為性能問題找到更多的原因。誰的做法是正確的?說你應(yīng)該在找到所有三個(gè)原因后就停止,可能很容易,但對(duì)于現(xiàn)實(shí)生活中的問題,你并不知道原因的數(shù)量。
這里有三種情況,你可以考慮停止分析,并提供了一些個(gè)人的例子。
當(dāng)你已經(jīng)解釋了大部分性能問題的時(shí)候。一個(gè) Java 應(yīng)用程序消耗的 CPU 資源是原來的 3 倍。我發(fā)現(xiàn)的第一個(gè)問題是異常堆棧消耗了 CPU。然后我量化了這些堆棧的時(shí)間,發(fā)現(xiàn)它們只占整個(gè) CPU 占用的 12%。如果這個(gè)數(shù)字接近 66%,我就可以停止分析了。但在這種情況下,在 12% 的情況下,我需要繼續(xù)尋找。
當(dāng)潛在的投資回報(bào)率低于分析的成本的時(shí)候。我所處理的一些性能問題可以帶來每年數(shù)千萬美元的收益。對(duì)于這些問題,我可以證明花幾個(gè)月的時(shí)間(工程成本)進(jìn)行分析是合理的。其他的性能問題,比如說微服務(wù),可能是以數(shù)百美元計(jì)算的,甚至不值得花 1 個(gè)小時(shí)的工程時(shí)間來分析它們。例外情況可能包括 :當(dāng)我沒有更好的事情可做時(shí)(這在實(shí)踐中從未發(fā)生過),或者如果我懷疑這可能是日后更大問題的隱患,值得在問題擴(kuò)大之前進(jìn)行調(diào)試時(shí)。
當(dāng)其他地方有更大的投資回報(bào)率的時(shí)候。即使前兩種情況沒有得到滿足,其他地方有更大的投資回報(bào)時(shí)經(jīng)常需要優(yōu)先考慮。如果你是全職的性能工程師,根據(jù)潛在的投資回報(bào)率對(duì)不同的問題進(jìn)行有選擇的分析可能是一項(xiàng)日常工作。
性能推薦的時(shí)間點(diǎn)
環(huán)境的性能特性會(huì)隨著時(shí)間改變,更多的用戶、新的硬件、升級(jí)的軟件或固件都是變化的因素。一種環(huán)境,受限于速度 10Gb/s 的網(wǎng)絡(luò)基礎(chǔ)設(shè)施,當(dāng)升級(jí)到 100Gb/s 時(shí),很可能會(huì)發(fā)現(xiàn)磁盤或 CPU 的性能變得緊張。
性能推薦,尤其是可調(diào)優(yōu)的參數(shù)值,僅僅在一段特定時(shí)間內(nèi)有效。一周內(nèi)從性能專家那里得到的好建議,可能到了下一周,經(jīng)過一次軟件或硬件升級(jí),或者用戶增多后就無效了。
在網(wǎng)上搜索找到的調(diào)優(yōu)參數(shù)值對(duì)于某些情況可能能快速見效。但如果對(duì)于你的系統(tǒng)或者工作負(fù)載并不合適,它們也可能會(huì)對(duì)性能有所損害,或者合適過一次,就不再合適了,或者只是作為軟件的某個(gè) bug 修復(fù)升級(jí)之前暫時(shí)的應(yīng)急措施。這和從別人的醫(yī)藥箱里拿藥吃很像,那些藥可能不適合你,或者可能已經(jīng)過期,或者只適合短期服用。
如果僅僅是出于要了解有哪些參數(shù)可調(diào)以及哪些參數(shù)在過去是需要調(diào)整的,那么瀏覽這些性能建議是有用的。針對(duì)你的系統(tǒng)和工作負(fù)載,這項(xiàng)工作就變成了考慮這些參數(shù)是不是要調(diào),以及調(diào)整成什么值。如果其他人不需要調(diào)整那個(gè)值,或者調(diào)整了但并未將經(jīng)驗(yàn)分享出來,那么你有可能漏掉了重要的參數(shù)。
負(fù)載與架構(gòu)
應(yīng)用程序性能差可能是因?yàn)檐浖渲煤陀布膯栴},也就是它的架構(gòu)和實(shí)現(xiàn)問題。另外,應(yīng)用程序性能差還可能是由于有太多負(fù)載,而導(dǎo)致了排隊(duì)和長(zhǎng)延時(shí)。負(fù)載和架構(gòu)見圖 2.5。
如果對(duì)架構(gòu)的分析顯示只是工作任務(wù)在排隊(duì),處理任務(wù)沒有任何問題,那么問題就可能出在施加的負(fù)載太多上。在云計(jì)算環(huán)境里,這是需要引入更多的服務(wù)器實(shí)例來處理任務(wù)的征兆。
舉個(gè)例子,架構(gòu)的問題可能是一個(gè)單線程的應(yīng)用程序在單個(gè) CPU 上忙碌,從而導(dǎo)致請(qǐng)求排隊(duì),但是其他的 CPU 卻是可用且空閑的。在這個(gè)例子里,性能就被應(yīng)用程序的單一線程架構(gòu)限制住了。架構(gòu)的另一個(gè)問題可能是一個(gè)程序的多個(gè)線程爭(zhēng)奪一個(gè)鎖,這樣只有一個(gè)線程可以向前推進(jìn),而其他線程在等待。
負(fù)載的問題可能會(huì)是一個(gè)多線程程序在所有的 CPU 上都忙碌,但是請(qǐng)求依然排隊(duì)的情況。在這個(gè)例子里,性能可能被限制于 CPU 的性能,或者說是負(fù)載超出了 CPU 所能處理的范圍。
指標(biāo)
性能指標(biāo)是由系統(tǒng)、應(yīng)用程序,或者其他工具選定的統(tǒng)計(jì)數(shù)據(jù),用于測(cè)量感興趣的活動(dòng)。性能指標(biāo)用于性能分析和監(jiān)測(cè),可以由命令行提供數(shù)據(jù),也可以由可視化工具提供圖表。
常見的系統(tǒng)性能指標(biāo)如下。
吞吐量 :每秒的數(shù)據(jù)量或操作量。
IOPS :每秒的 I/O 操作數(shù)。
使用率 :資源的繁忙程度,以百分比表示。
延時(shí) :操作時(shí)間,以平均數(shù)或百分?jǐn)?shù)表示。
吞吐量的使用取決于上下文環(huán)境。數(shù)據(jù)庫(kù)吞吐量通常用來度量每秒查詢或請(qǐng)求的數(shù)目(操作量)。網(wǎng)絡(luò)吞吐量度量的是每秒傳輸?shù)谋忍財(cái)?shù)或字節(jié)數(shù)(數(shù)據(jù)量)。IOPS 度量的是吞吐量,但只針對(duì) I/O 操作(讀取和寫入)。再次重申,上下文很關(guān)鍵,上下文不同,定義可能會(huì)有不同。
緩存
緩存被頻繁使用來提高性能。緩存是將較慢的存儲(chǔ)層的結(jié)果存放在較快的存儲(chǔ)層中。
把磁盤的塊緩存在主存(RAM)中就是一例。
一般使用的都是多級(jí)緩存。CPU 通常利用多級(jí)硬件緩存作為主緩存(L1、L2 和L3),開始是一個(gè)非??斓呛苄〉木彺妫↙1),后續(xù)的 L2 和 L3 逐漸增加了緩存容量和訪問延時(shí)。這是一個(gè)在密度和延時(shí)之間經(jīng)濟(jì)上的權(quán)衡。緩存的級(jí)數(shù)和大小的選擇以CPU 芯片內(nèi)可用空間為準(zhǔn),確保達(dá)到最優(yōu)的性能。
一個(gè)了解緩存性能的重要指標(biāo)是每個(gè)緩存的命中率—所需數(shù)據(jù)在緩存中被找到的次數(shù)(hits,命中)與總訪問次數(shù)(hits+misses)的比例。
命中率 = 命中次數(shù) /(命中次數(shù) + 失效次數(shù))
命中率越高越好,更高的命中率意味著更多的數(shù)據(jù)能成功地從較快的介質(zhì)中訪問獲得。
98% 和 99% 之間的性能差異要比 10% 和 11% 之間的性能差異大很多。由于緩存命中和失效之間的速度差異(兩個(gè)存儲(chǔ)層級(jí)),導(dǎo)致了這是一條非線性曲線。兩個(gè)存儲(chǔ)層級(jí)速度差異越大,曲線越陡峭。
已知的未知
已知的已知、已知的未知、未知的未知在性能領(lǐng)域是很重要的概念。下面是詳細(xì)的解釋,并提供了系統(tǒng)性能分析的例子。
已知的已知 :有些東西你知道。你知道你應(yīng)該檢查性能指標(biāo),你也知道它的當(dāng)前值。舉個(gè)例子,你知道你應(yīng)該檢查 CPU 使用率,而且你也知道當(dāng)前均值是10%。
已知的未知 :有些東西你知道你不知道。你知道你可以檢查一個(gè)指標(biāo)或者判斷一個(gè)子系統(tǒng)是否存在,但是你還沒去做。舉個(gè)例子,你知道你能用剖析檢查是什么致使 CPU 忙碌,但你還沒去做這件事。
未知的未知 :有些東西你不知道你不知道。舉個(gè)例子,你可能不知道設(shè)備中斷可以消耗大量 CPU 資源,因此你對(duì)此并不做檢查。在性能領(lǐng)域,“你知道的越多,你不知道的也就越多”。這和學(xué)習(xí)系統(tǒng)是一樣的原理:你了解的越多,你就能意識(shí)到未知的未知越多,然后這些未知的未知會(huì)變成你可以去查看的已知的未知。
審核編輯 :李倩
-
數(shù)據(jù)傳輸
+關(guān)注
關(guān)注
9文章
1928瀏覽量
64715 -
計(jì)算機(jī)系統(tǒng)
+關(guān)注
關(guān)注
0文章
289瀏覽量
24149 -
測(cè)量
+關(guān)注
關(guān)注
10文章
4915瀏覽量
111569
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論