1. 引言
密碼技術(shù)是保護網(wǎng)絡(luò)與信息系統(tǒng)安全的核心技術(shù),已經(jīng)廣泛應(yīng)用到金融、能源、通信、交通、水利等各行各業(yè),為國家安全和經(jīng)濟發(fā)展發(fā)揮重要作用。商用密碼應(yīng)用安全性評估(簡稱密評),是指在釆用商用密碼技術(shù)、產(chǎn)品和服務(wù)集成建設(shè)的網(wǎng)絡(luò)和信息系統(tǒng)中對密碼應(yīng)用的合規(guī)性、正確性和有效性等進行評估。對信息系統(tǒng)開展密評是規(guī)范密碼應(yīng)用、維護網(wǎng)絡(luò)空間安全的基本要求,同時又可促進國產(chǎn)密碼在各個行業(yè)的廣泛應(yīng)用。
隨著應(yīng)用場景的多元化,對密碼算法的性能及安全性需求提出了不同要求,尤其是應(yīng)用最為廣泛的SM4密碼算法。例如,網(wǎng)絡(luò)和通信安全需要采用密碼技術(shù)對通信過程中的敏感數(shù)據(jù)做機密性保護,這對SM4算法高性能實現(xiàn)提出了具體需求,否則會對系統(tǒng)的性能造成較明顯的損耗,影響網(wǎng)絡(luò)通信能力。另一方面,多路視頻高清和超高清監(jiān)控數(shù)據(jù)需要超高性能的密碼算法進行保護,否則可能影響方案的可實施性。此外,還有很多行業(yè)對加密存儲提出了高性能需求。近些年來Intel、AMD等處理器廠商紛紛宣布在其處理器上推出用于AES加解密的AES-NI指令集,這使得采用AES-NI指令集實現(xiàn)AES算法的性能得到進一步提升。目前SM4算法性能與AES算法相比有一定差距,特別是與AES-NI加速指令的差距更加明顯,若不盡快補齊性能短板,必將影響國密算法的廣泛應(yīng)用。
2. SM4算法實現(xiàn)介紹
SM4分組密碼算法是我國的商用分組密碼算法,分組長度為128比特,密鑰長度也是128比特,加密算法與密鑰擴展算法都采用32輪廣義Feistel結(jié)構(gòu)進行迭代,解密算法與加密算法的結(jié)構(gòu)相同,只是輪密鑰的使用順序相反。
為了高效地實現(xiàn)SM4算法,國內(nèi)外眾多學者提出了多種軟硬件工程實現(xiàn)思路。早期的SM4軟件實現(xiàn)方法僅限于查表實現(xiàn),但因SM4算法架構(gòu)等因素,其查表實現(xiàn)的性能明顯低于AES算法。國內(nèi)外許多學者嘗試采用SIMD技術(shù)應(yīng)用到密碼算法的軟件快速實現(xiàn)中,例如SSE指令集、AVX指令集等。SIMD可實現(xiàn)一條指令操作多個數(shù)據(jù),是CPU基本指令集的擴展,用于提供數(shù)據(jù)的并行操作,如數(shù)字圖像處理。學者們將SSE指令與比特切片等技術(shù)應(yīng)用到密碼算法以提高算法的實現(xiàn)性能。中科院軟件所[1]利用SIMD技術(shù)優(yōu)化實現(xiàn)SM4算法,該方法相比于查表方法,其軟件實現(xiàn)性能可以提高85%至138%。北航軟件開發(fā)環(huán)境國家重點實驗室 [2]簡化S盒,采用比特切片技術(shù),結(jié)合AVX指令實現(xiàn)SM4算法的256個分組并行加解密,實現(xiàn)效率提高了43%。2014年,Intel公司[3]提出了基于AES-NI指令集實現(xiàn)SM4的專利,2017年,道里云公司[4]也公開發(fā)表了使用AES-NI指令集實現(xiàn)SM4的另一種方案。
另外,也有借助硬件GPU進行SM4加速實現(xiàn)的方案。北京電科院[5]通過研究最優(yōu)明文數(shù)據(jù)塊、GPU存儲類型和線程塊對SM4加密的加速比,提出GPU并行SM4加解密方案,將性能提升到25倍左右。中國工業(yè)控制系統(tǒng)網(wǎng)絡(luò)應(yīng)急響應(yīng)小組[6]利用CUDA提出了SM4的CPU-GPU方案,并引入頁鎖內(nèi)存和CUDA流方案使得SM4的速度提升到88倍左右。以上兩篇文章都指出,當明文數(shù)據(jù)塊較小時(如小于8KB),由于CPU和GPU之間的數(shù)據(jù)交互傳輸耗時以及小數(shù)據(jù)包時GPU無法調(diào)用全部的計算單元參與運算,使得GPU方案的效率可能不升反降,因此應(yīng)用場景有一定的局限性。此外,GPU本身的性能也與加速效果強相關(guān)。
3. 10Gb每秒!海泰的新篇章!
作為一家以密碼為基因、以創(chuàng)新為驅(qū)動的企業(yè),海泰方圓持續(xù)重視研發(fā)投入,2022年,公司研發(fā)中心和技術(shù)體系啟新,全新的“密碼技術(shù)融合創(chuàng)新中心”和“數(shù)據(jù)智能安全工程中心”隆重啟用。公司以密碼技術(shù)融合創(chuàng)新中心為依托,加速布局密碼業(yè)務(wù),深化技術(shù)創(chuàng)新研究,深耕國密算法高性能實現(xiàn),基于國內(nèi)外研究成果進行SM4的軟件高性能實現(xiàn)研究。
重點針對CPU流水線和不同類型的SIMD的深入理解和分析,結(jié)合SSE、AVX指令集的并行化實現(xiàn)特點以及對SM4性能優(yōu)化的改善程度,剖析不同工作模式的可并行性以及對并行加解密性能的改善情況,設(shè)計出高性能的SM4并行實現(xiàn)方法。此外,設(shè)計的SM4高性能實現(xiàn)自適應(yīng)匹配技術(shù)以及內(nèi)置智能最優(yōu)解方案模塊,可根據(jù)監(jiān)測的CPU架構(gòu)特征自適應(yīng)地匹配符合CPU特征的高性能加解密方案,自動快速搜尋局部最優(yōu)解,使得加解密性能達盡可能達到局部最優(yōu)。該方案已部署在SM4算法的五種常見工作模式中,在英特爾十一代I5處理器上優(yōu)化部署后的SM4軟件高性能實現(xiàn)方案性能從原有的3.54Gbps(百萬比特每秒)提升至7.36Gbps,性能為原方案的2.08倍;在英特爾的十一代I7處理器上進行單線程性能測試,ECB模式的加密和解密速度達到10 Gbps,CTR模式的加解和解密性能不低于9 Gbps,CBC模式和CFB模式的解密性能也都超過9 Gbps,如下圖。
圖2 海泰SM4高性能密碼實現(xiàn)方案的性能
SM4實現(xiàn)方案除了已經(jīng)支持上述五種常見工作模式之外,其它更多的工作模式也正在全力支持中。此外,在海泰的密碼技術(shù)融合創(chuàng)新中心,SM4算法高性能實現(xiàn)還在進行持續(xù)迭代,多種模式的實驗室測試數(shù)據(jù)均在10 Gbps以上。
4. 高性能SM4的應(yīng)用
在大數(shù)據(jù)時代,海量數(shù)據(jù)需要進行安全防護,隨著技術(shù)的迭代,多種新型存儲技術(shù)快速發(fā)展,傳統(tǒng)150MB/s(百萬字節(jié)每秒)左右存儲速度的HDD硬盤已經(jīng)開始逐漸向更加快速的可達到500MB/s的固態(tài)硬盤SSD存儲技術(shù)轉(zhuǎn)變,甚至PCIe/M.2 SSD的速度范圍可以達到1.0GB/s到2.0GB/s。這使得存儲技術(shù)已不再是制約海量數(shù)據(jù)安全存儲的短板了,而SM4密碼算法傳統(tǒng)的軟件實現(xiàn)方案不足1Gbps(125MB/s),即使高性能硬件加密卡的4Gbps(500MB/s)的加解密速度也只能剛好與普通SSD的性能持平。以上數(shù)字都清晰地指出SM4加解密速度已經(jīng)成為海量數(shù)據(jù)安全存儲的瓶頸,嚴重制約商密算法的應(yīng)用,特別是在海量數(shù)據(jù)安全存儲等應(yīng)用場景。因此,市場迫切需要更高效的SM4算法,避免將國密算法置入性能瓶頸的尷尬之地。
海泰SM4算法的高性能實現(xiàn),使得單線程的加解密速度可達到10Gbps(1.25GB/s),多線程可達到100Gbps以上,這使得海量數(shù)據(jù)的安全存儲和安全“閃”存得以實現(xiàn)。
此外,幾乎所有的數(shù)據(jù)密集型應(yīng)用場景都將是海泰高性能SM4算法大顯身手之處。當前,移動應(yīng)用、AI應(yīng)用、AR/VR、云手機、物聯(lián)網(wǎng)、車聯(lián)網(wǎng)等新型應(yīng)用、智能物聯(lián)網(wǎng)應(yīng)用爆發(fā)式增長,更加多樣化的算力產(chǎn)生在云上,提供個性化服務(wù),改變?nèi)藗兊纳?,這些應(yīng)用場景要求簡化現(xiàn)有IT基礎(chǔ)架構(gòu),優(yōu)化服務(wù)器資源利用率,提高系統(tǒng)可用性,這是海泰密碼技術(shù)賦能高質(zhì)量密碼供給,確保數(shù)據(jù)安全的重要應(yīng)用領(lǐng)域。
與此同時,海泰高性能SM4也與相關(guān)密碼產(chǎn)品進行對接集成,支持更多的密碼產(chǎn)品,為更多的安全產(chǎn)品賦能更高性能的國密算法實現(xiàn),提供更加完善的安全功能,為云計算、大數(shù)據(jù)、物聯(lián)網(wǎng)、移動互聯(lián)、工業(yè)控制、人工智能等領(lǐng)域提供更加完善的安全服務(wù)。
5. 總結(jié)與展望
如今,海泰正全面開展國產(chǎn)密碼算法系列的高性能實現(xiàn),不僅進一步優(yōu)化SM4算法性能,還在進行SM3算法、SM2算法、SM9算法、ZUC算法的高性能實現(xiàn),將商密算法的高性能實現(xiàn)延展到國產(chǎn)化平臺,助力國產(chǎn)化安全。
審核編輯:湯梓紅
-
密碼技術(shù)
+關(guān)注
關(guān)注
0文章
22瀏覽量
7589 -
SM4算法
+關(guān)注
關(guān)注
0文章
3瀏覽量
1535 -
SM4
+關(guān)注
關(guān)注
0文章
4瀏覽量
2465
發(fā)布評論請先 登錄
相關(guān)推薦
評論