Flexera發(fā)布的《2021年云計(jì)算市場發(fā)展?fàn)顟B(tài)報(bào)告》數(shù)據(jù)顯示,82%的受訪企業(yè)計(jì)劃或已經(jīng)部署了混合云,10%的受訪企業(yè)部署了多云環(huán)境。同時(shí)工信部華信研究院數(shù)據(jù)顯示,整個(gè)云計(jì)算市場保持穩(wěn)定增長的同時(shí),私有云市場漲幅更為明顯。這表明在企業(yè)級混合云市場,私有云、公有云和混合云成為企業(yè)云戰(zhàn)略方向的主要選擇,也是企業(yè)數(shù)字化轉(zhuǎn)型的重要利器。
作為承載千行百業(yè)的數(shù)字化轉(zhuǎn)型的IDC廠商世紀(jì)互聯(lián),服務(wù)了超6000家客戶,25年間一直處于數(shù)字化轉(zhuǎn)型的生態(tài)之中,一路見證其數(shù)字化轉(zhuǎn)型帶來的巨大改變。世紀(jì)互聯(lián)秉持“讓數(shù)字化簡單易得”的理念,攜手更多合作伙伴,持續(xù)深耕一體化數(shù)據(jù)中心的建設(shè)與布局,助力全國一體化大數(shù)據(jù)中心協(xié)同創(chuàng)新體系的構(gòu)建,助力各行各業(yè)加速實(shí)現(xiàn)數(shù)字化轉(zhuǎn)型。
面對混合云趨勢,世紀(jì)互聯(lián)基于云計(jì)算技術(shù)新一代整體托管及運(yùn)維的互聯(lián)網(wǎng)基礎(chǔ)設(shè)施托管服務(wù),提出互聯(lián)網(wǎng)基礎(chǔ)設(shè)施Services+戰(zhàn)略。在IDC架構(gòu)發(fā)展過程中,基于標(biāo)準(zhǔn)的服務(wù)器集群、可擴(kuò)展的數(shù)據(jù)中心網(wǎng)絡(luò)以及共享存儲打造的集中式、標(biāo)準(zhǔn)化建設(shè)的“糖葫蘆串”架構(gòu)雖然進(jìn)一步降低基礎(chǔ)設(shè)施復(fù)雜性,但是隨著企業(yè)業(yè)務(wù)的增加和變化,整個(gè)架構(gòu)的性能和擴(kuò)展性形成挑戰(zhàn)。世紀(jì)互聯(lián)提出的互聯(lián)網(wǎng)基礎(chǔ)設(shè)施Services+戰(zhàn)略打破原有的大集中和標(biāo)準(zhǔn)化建設(shè),以云原生技術(shù)為核心,基于計(jì)算、網(wǎng)絡(luò)、存儲虛擬化資源池打造的云計(jì)算基礎(chǔ)設(shè)施——企業(yè)托管私有云EHPC服務(wù),具備快速配置、隨需應(yīng)變、整體租用等優(yōu)勢,能夠增強(qiáng)資源利用率,提高伸縮性彈性管理應(yīng)用和數(shù)據(jù)需求規(guī)?;⒔档统杀?,大大提高了提高業(yè)務(wù)敏捷性,實(shí)現(xiàn)了高效滿足業(yè)務(wù)發(fā)展的需求。
同時(shí)基于世紀(jì)互聯(lián)集團(tuán)集團(tuán)下的互聯(lián)科技NEOLINK混合云平臺,結(jié)合在2021年7月收購的TCE(TenxCloudContainerEnterprise,時(shí)速容器云)平臺,打造了支持云原生的下一代架構(gòu),在基礎(chǔ)設(shè)施層推出了面向行業(yè)數(shù)字化的虛擬數(shù)據(jù)中心、托管私有云、容器平臺、裸金屬和混合云一體機(jī)柜等混合云服務(wù),通過互聯(lián)科技統(tǒng)一多云管理服務(wù)門戶為多云管理信息采集、數(shù)據(jù)服務(wù)提供數(shù)據(jù)中心互聯(lián)、云互聯(lián)、云原生服務(wù)互聯(lián)以及云安全互聯(lián)等統(tǒng)一多云的管理服務(wù),滿足不同行業(yè)、不同業(yè)務(wù)應(yīng)用場景,加速企業(yè)數(shù)字化轉(zhuǎn)型進(jìn)程。
業(yè)務(wù)高速增長為互聯(lián)科技平臺帶來的技術(shù)挑戰(zhàn)
但是我們也看到,新興技術(shù)的發(fā)展為企業(yè)帶來了全新的可能性的同時(shí),也帶來了如何利用企業(yè)數(shù)字化轉(zhuǎn)型到達(dá)最佳成果的調(diào)整。對于世紀(jì)互聯(lián)而言,如何幫助企業(yè)用好云、管好云并釋放云的技術(shù)紅利也成為云服務(wù)商面臨的重要挑戰(zhàn)。世紀(jì)互聯(lián)業(yè)務(wù)在高速增長的同時(shí),互聯(lián)科技混合云架構(gòu)在支撐整個(gè)集團(tuán)業(yè)務(wù)發(fā)展的過程中,也面臨以下幾個(gè)挑戰(zhàn):
第一,能耗問題。世紀(jì)互聯(lián)集團(tuán)作為一家以建設(shè)IDC為主體的公司,一直緊跟國家政策和發(fā)展方向,致力于打造低碳高效的商用IDC環(huán)境,集團(tuán)上下十分注重節(jié)能減排的各項(xiàng)措施?;ヂ?lián)科技混合云平臺希望在不同的業(yè)務(wù)負(fù)載情況下,能有更智能和動(dòng)態(tài)的的模式來保持性能要求并相對節(jié)約能耗。
第二,性能問題。隨著混合云業(yè)務(wù)的增加,比如云原生、對于平臺性能的要求越來越高,平臺時(shí)常出現(xiàn)性能瓶頸,不能對多樣的業(yè)務(wù)需求提供有力支持。
第三,成本問題。集團(tuán)業(yè)務(wù)的增加,需要實(shí)現(xiàn)虛擬機(jī)的大量部署,從而造成了集群的內(nèi)存一直處在高負(fù)載狀態(tài),且單純擴(kuò)充DRAM會(huì)造成成本高昂,對整個(gè)平臺運(yùn)營成本帶來大的挑戰(zhàn)。
第四,可靠性問題,互聯(lián)科技為對外提供企業(yè)私有云和企業(yè)虛擬機(jī)服務(wù),近一年時(shí)間相關(guān)業(yè)務(wù)增長較為迅速,企業(yè)私有云機(jī)柜數(shù)量也保持高量增長。多數(shù)業(yè)務(wù)為基于VMware底層對外提供服務(wù),2021年上半年統(tǒng)計(jì)角度來看有比較高的幾率出現(xiàn)內(nèi)存CE錯(cuò)誤”,內(nèi)存UCE錯(cuò)誤,更嚴(yán)重者可能會(huì)出現(xiàn)Esxi宿主機(jī)出現(xiàn)紫屏宕機(jī)的情況,嚴(yán)重影響云平臺對外提供服務(wù)底層的穩(wěn)定性及可靠性。
英特爾新一代平臺釋放的技術(shù)價(jià)值
互聯(lián)科技長期以來與英特爾在新技術(shù)引入和使用方面有著深度和全面的合作?;诨旌显破脚_面臨的痛點(diǎn),通過和英特爾專家的交流,采用英特爾第三代至強(qiáng)可擴(kuò)展處理器產(chǎn)品和加擴(kuò)傲騰持久內(nèi)存等產(chǎn)品和解決方案,并根據(jù)不同的業(yè)務(wù)應(yīng)用場景進(jìn)行試驗(yàn)和測試,實(shí)現(xiàn)了整個(gè)平臺的能耗、性能、可靠性以及成本等方面的優(yōu)化,為后續(xù)推廣和部署提供了數(shù)據(jù)支持和保證。
新一代Icelake實(shí)現(xiàn)業(yè)務(wù)系統(tǒng)感知的高效數(shù)據(jù)中心
通過深度集成IntelDynamic SST能力到世紀(jì)互聯(lián)TCE(TenxCloudContainer Enterprise,時(shí)速容器云)平臺,基于TCE(TenxCloudContainerEnterprise)容器產(chǎn)品為基礎(chǔ)環(huán)境,在相同硬件、產(chǎn)品、負(fù)載等條件一致的情況下,對采用具備SST高級功能的IntelCPU產(chǎn)品,根據(jù)不同的業(yè)務(wù)應(yīng)用場景進(jìn)行試驗(yàn),通過調(diào)整動(dòng)態(tài)SST-PerformanceProfile,采用指定SST-PP方式降低功耗(針對于高性價(jià)比要求的應(yīng)用場景和產(chǎn)品,要求做到客戶無感知),分析對數(shù)據(jù)中心電力的影響,打通了基礎(chǔ)架構(gòu)層和云原生調(diào)度層的動(dòng)態(tài)協(xié)同能力,為時(shí)速云提供更加靈活高效的節(jié)能調(diào)節(jié)及控制方式,從而實(shí)現(xiàn)業(yè)務(wù)系統(tǒng)感知的高效數(shù)據(jù)中心節(jié)能減排目標(biāo)。
測試結(jié)果顯示,通過選購的Y系列IntelCPU,在應(yīng)用SST技術(shù)的基礎(chǔ)上,使得互聯(lián)科技進(jìn)一步整合了CPU資源,精簡了CPU的型號選擇。通過本次實(shí)驗(yàn),SST-PP應(yīng)用前后對整集群性能的影響可以做到對客戶“無感知”,單R機(jī)柜單臺服務(wù)器受到CPU功耗變化,每日基礎(chǔ)電力消耗可降低0.4A-0.42A,整月估算通過SST-PP的整合后可降低R機(jī)柜單臺服務(wù)器約為12A消耗。
世紀(jì)互聯(lián)即將采用英特爾尾標(biāo)帶“Y”具備SST高級功能的CPU服務(wù)器目前總數(shù)約為500臺,占據(jù)45R機(jī)柜。粗略計(jì)算集群可節(jié)約電力開銷約550萬/年~926萬/年,對整個(gè)集團(tuán)未來完成節(jié)能目標(biāo)都具有十分重要的意義。
新一代Icelake助力容器云高性能計(jì)算
針對容器云面臨的性能瓶頸,互聯(lián)科技需要引入有更高計(jì)算能力、更多核心線程數(shù)的高密度CPU來提升集群整體性能及業(yè)務(wù)能力。經(jīng)過和英特爾專家的交流,選定XeonPlatinum8352V進(jìn)行測試,選擇的原因主要是在價(jià)格最優(yōu)的情況下,8352V可以提供更多的核心數(shù)和線程數(shù),提供更強(qiáng)大的資源能力,更適用于云環(huán)境的TCO標(biāo)準(zhǔn)?;ヂ?lián)科技通過測試CPU計(jì)算能力和并行能力展示了IntelXeon Platinum 8352V CPU 在容器場景下的測試驗(yàn)證效果。
測試一:以容器方式跑sysbench,測試CPU計(jì)算能力
經(jīng)測試對比,8352V高性能機(jī)型比標(biāo)準(zhǔn)機(jī)型在單位時(shí)間計(jì)算能力有50%~70%提升。參考官方價(jià)格對比TCO和性能增長,在目前使用較多的4Threads和8Threads場景下,性能的增長滿足業(yè)務(wù)要求,且與TCO的增加差異在客戶可接受范圍內(nèi)。8352V可推薦在高性能計(jì)算業(yè)務(wù)場景使用。
測試二:采用LoadRunner模擬操作用戶對應(yīng)用發(fā)起并發(fā)測試
經(jīng)對比測試,8352V機(jī)型與標(biāo)準(zhǔn)機(jī)型做同樣并發(fā)數(shù)壓力測試,8352V機(jī)型有較多CPU空閑率,且TPS有將近50%的提高。尤其是在高并發(fā)數(shù)400的測試下,5318Y已經(jīng)達(dá)到瓶頸,而8352V憑借著更多資源調(diào)度能力,CPU并未跑滿,還可以繼續(xù)提供更多服務(wù)。
經(jīng)測試評估,8352V機(jī)型憑借更多的資源,更強(qiáng)的性能可滿足互聯(lián)科技高性能密集型業(yè)務(wù)需求,相比標(biāo)準(zhǔn)機(jī)型,對關(guān)鍵業(yè)務(wù)性能有顯著提升。在互聯(lián)科技完成收購時(shí)速云后,滿足時(shí)速云產(chǎn)品提供更高性能且高競爭力的產(chǎn)品的需求,實(shí)現(xiàn)為客戶側(cè)新基建帶來行業(yè)領(lǐng)先的云原生產(chǎn)品、專業(yè)成熟的解決方案和客戶服務(wù)能力,為客戶數(shù)字化轉(zhuǎn)型的全生命周期提供強(qiáng)大動(dòng)能。
傲騰內(nèi)存助力互聯(lián)科技打造低成本多樣化方案
互聯(lián)科技目前LevelDB集群CPU平均尚有約25%~40%的空閑,但內(nèi)存基本處于持續(xù)滿載狀態(tài),擴(kuò)容需求很緊急,面對現(xiàn)有內(nèi)存瓶頸,在考慮成本為高優(yōu)先級的前提下,采用BPS的配置,實(shí)現(xiàn)了在性能可以接受的情況下,TCO效益優(yōu)勢明顯。目前互聯(lián)科技已經(jīng)追加了BPS到近期采購清單。
在整機(jī)TCO提升24%的情況下,內(nèi)存容量得到9倍提升,讀性能提升1.5倍左右。受BPS帶寬較低(相較DRAM)影響,寫性能降低到70%~80%之間,尚在可接受范圍內(nèi)。
本次測試中的兩個(gè)機(jī)型的橫向?qū)Ρ戎?,使用二代傲騰BPS大容量內(nèi)存的機(jī)型,僅寫性能受到了一定影響,內(nèi)存容量和讀性能都有較大提升。綜合考慮,面對現(xiàn)有內(nèi)存瓶頸,在考慮成本為高優(yōu)先級的前提下,擴(kuò)充BPS是一個(gè)正確的選擇。
英特爾IcelakeMAC提高互聯(lián)科技運(yùn)營穩(wěn)定性
針對互聯(lián)科技云平臺對外提供服務(wù)底層的穩(wěn)定性及可靠性需求,對其私有云環(huán)境內(nèi)全部宿主機(jī)進(jìn)行測試。通過在下半年使用Intel新的Icealake處理器,并開啟AdvancedRAS中IntelMCARecovery后,在穩(wěn)定性、可靠性的統(tǒng)計(jì)對比情況,良好的數(shù)據(jù)對比讓互聯(lián)科技將開啟MCA作為一項(xiàng)重要的技術(shù)手段來提升世紀(jì)互聯(lián)整體的競爭力。
本次測試集群宿主機(jī)為20+節(jié)點(diǎn)的AllFlash集群、資源置備用量約為70%左右,CPU計(jì)算資源均全線升級為最新IntelIcelake平臺。在升級到英特爾最新的Icelake基礎(chǔ)之上,應(yīng)用MCA技術(shù)到部分集群,使得系統(tǒng)可以探測硬件錯(cuò)誤:如系統(tǒng)總線錯(cuò)誤,ECC錯(cuò)誤,奇偶校驗(yàn)錯(cuò)誤,cache錯(cuò)誤,TLB錯(cuò)誤等等。本次測試驗(yàn)證了MCA可以有效的檢測并自動(dòng)恢復(fù)CPU或內(nèi)存中的部分邏輯壞損或報(bào)錯(cuò),自動(dòng)終止該錯(cuò)誤線程,提高系統(tǒng)穩(wěn)定可靠性,為運(yùn)維排錯(cuò)爭取了更多的時(shí)間窗口。
結(jié)合三季度至今的故障率統(tǒng)計(jì)得出,在開啟MCA后同一集群發(fā)生故障率在21年下半年為3%左右,相較21年上半年的15%改善明顯,集群的整體穩(wěn)定性提升了5倍左右。對于客戶服務(wù)IntelMCA Recovery的啟用,效果非常明顯,降低了私有云底層硬件的故障屢,有效的提高了客戶服務(wù)SLA。
英特爾攜手云平臺賦能千行百業(yè)
混合云平臺是未來企業(yè)數(shù)字化轉(zhuǎn)型的首要選擇,互聯(lián)科技和英特爾的合作,也是對整個(gè)混合云平臺全面升級的一次合作。通過深度集成英特爾各項(xiàng)能力到互聯(lián)科技云平臺,提高了互聯(lián)科技內(nèi)部的研發(fā)實(shí)力,和互聯(lián)科技服務(wù)客戶的深度和廣度,為互聯(lián)科技龐大的客戶群提供行業(yè)領(lǐng)先、完整的端到端的云原生產(chǎn)品及解決方案,成為更加開放和創(chuàng)新活力的新一代互聯(lián)網(wǎng)基礎(chǔ)設(shè)施。
可以看到雙方的合作,不僅可以窺探出企業(yè)對于混合云平臺在技術(shù)創(chuàng)新發(fā)展的趨勢,從而推動(dòng)業(yè)界標(biāo)準(zhǔn)的提高。同時(shí)在通過軟硬件結(jié)合充分發(fā)揮CPU平臺的整合能力,不斷擴(kuò)展混合云平臺所支持的應(yīng)用場景及其PaaS服務(wù)特性,助力包括互聯(lián)科技等云平臺服務(wù)于千行百業(yè)。
審核編輯:符乾江
-
處理器
+關(guān)注
關(guān)注
68文章
19313瀏覽量
230055 -
英特爾
+關(guān)注
關(guān)注
61文章
9978瀏覽量
171868
發(fā)布評論請先 登錄
相關(guān)推薦
評論