隨著過去20年計算的突飛猛進(jìn),及其對商業(yè)、教育、科研、醫(yī)療機(jī)構(gòu)及其他行業(yè)帶來的社會效益,計算的能源和環(huán)境足跡也相應(yīng)地增加。全球30億臺個人電腦每年消耗的能量超過總能耗的的1%;全球3,000萬臺服務(wù)器將再增加1.5%的總用電量,每年耗費約140億至180億美元。
由于全球上網(wǎng)用戶越來越多,據(jù)預(yù)測到2018年,全球數(shù)據(jù)中心的總占地面積將從2013年的15億平方英尺增加到近20億平方英尺。這些計算中心的服務(wù)器不僅會連接到個人電腦、電話和平板電腦,還會連接到大量新型聯(lián)網(wǎng)設(shè)備和系統(tǒng)。盡管可能會與預(yù)期有所出入,但保守估計,到2020年將會有近260億臺包含可穿戴計算機(jī)和工業(yè)傳感器在內(nèi)的各種設(shè)備連接到互聯(lián)網(wǎng)。這就意味著互聯(lián)網(wǎng)流量會大幅增加,預(yù)計到2015年將會從2010年的245EB增加到1,000EB.
與用戶對高能效性能的需求相結(jié)合,智能手機(jī)、平板電腦和游戲機(jī)等將被用于計算密集型任務(wù)中,比如流媒體、視覺體驗效果更豐富的游戲和增強(qiáng)現(xiàn)實。同時,在視頻編輯、語音和手勢識別及基于生物特征信息的數(shù)據(jù)安全等方面,用戶對便攜式電腦和臺式電腦的需求也不斷升溫。這些因素強(qiáng)力推動著提高處理器性能同時降低能耗的技術(shù)創(chuàng)新。
能源效率的現(xiàn)狀
能源效率是數(shù)字移動革命的主要推動因素之一。20世紀(jì)40年代至今,計算效率提高了好幾個數(shù)量級,因此筆記本電腦、平板電腦和手機(jī)在電池充滿電的條件下可以持續(xù)工作幾個小時。由于電池技術(shù)的發(fā)展速度明顯落后于計算性能的增長速度,移動設(shè)備制造商只能集成多項技術(shù)來延長電池的續(xù)航時間。比如,智能手機(jī)和筆記本電腦在空閑一定時間后會自動進(jìn)入休眠狀態(tài)。
如下這些改進(jìn)將具有深遠(yuǎn)的影響:假如美國境內(nèi)銷售的計算機(jī)都通過了能源之星認(rèn)證,那么每年可節(jié)約資金10億美元,同時溫室氣體排放量也能減少150億磅,這相當(dāng)于140萬臺汽車一年的排放量。
20世紀(jì)80年代和90年代是微處理器性能和計算效率大幅提升的黃金時代。晶體管越來越小,設(shè)計人員可以在單個芯片上集成更多晶體管,處理器的時鐘頻率同時得到提高,進(jìn)而用戶計算機(jī)的性能得到提高。但是晶體管再小,功率密度基本上保持不變—這種現(xiàn)象被稱為登納德縮放比例定律。這就是說每一代新處理器每單位計算能力的能耗都會減少至上一代的1/4,同時電壓和電容也相應(yīng)降低。
但是,21世紀(jì)初,晶體管仍越來越小,單個芯片上可集成的晶體管數(shù)量仍在增加,但能源效益的增速卻在逐漸放緩。主要原因是晶體管的尺寸已接近物理極限。晶體管越小,制造過程中漏電的可能性就越大,因為晶體管的閾值電壓已經(jīng)降低到器件不完全關(guān)斷的點。登納德縮放比例定律中的這一完結(jié)會增加消費者所期望的高集成度、高性能器件的功耗,從而需要采用更復(fù)雜的散熱技術(shù)和創(chuàng)新的電源管理技術(shù)。
這最終導(dǎo)致半導(dǎo)體制造商不能單純依靠工藝的改進(jìn)來提高能源效率。此外,即使工程師保持摩爾定律與其歷史性能軌跡相吻合,也同樣需要探索新技術(shù),來讓能源效率的增長速度媲美早期的增長速度。
AMD 25×20計劃
AMD的工程師認(rèn)真研究了上述趨勢和降低信息技術(shù)對環(huán)境影響的市場需求,以及延長電池壽命和提高更加輕薄小巧產(chǎn)品性能的需求。因此,過去幾年他們大大提高了AMD處理器的性能。AMD認(rèn)識到不能滿足于現(xiàn)狀,因此在2014年6月提出了到2020年實現(xiàn)加速處理器(APU)能效提高25倍的目標(biāo),或“25×20”計劃。
AMD使用平臺性能除以典型應(yīng)用能耗獲得的典型應(yīng)用效率指數(shù),來實現(xiàn)每單位能耗執(zhí)行工作的單次測量。通過使用曲線,可以清楚地看到典型應(yīng)用實際上是由空閑功耗而非峰值計算功耗所主導(dǎo)。目前有許多電源相關(guān)的創(chuàng)新技術(shù),可以在不影響性能的前提下最大限度地增加空閑時間,降低空閑功耗。當(dāng)然,性能是一個關(guān)鍵參數(shù)—用戶希望獲得快速響應(yīng)、快速運算和無縫視頻回放。他們還希望擁有更長的電池續(xù)航時間、更輕薄小巧的尺寸和更小的環(huán)境影響。只要能優(yōu)化典型應(yīng)用的能效,上述問題就可以迎刃而解。
要實現(xiàn)25x20目標(biāo),就必須通過開使用技術(shù)和新方法大幅提高典型應(yīng)用效率的提升速度。根據(jù)這一目標(biāo),從2014到2020年,AMD產(chǎn)品功耗的降低至少要比摩爾定律預(yù)測的歷史效率趨勢高出70%.這就是說到2020年,一臺計算機(jī)完成同一項任務(wù)的用時將是目前個人電腦的1/5,而平均用電量也將不到目前個人電腦的1/5.這就好比僅用六年時間就將原來100馬力的汽車變身為一輛500馬力的汽車,同時每加侖燃料的行駛距離也從原來的30英里增加到150英里。
實現(xiàn)25x20目標(biāo)
架構(gòu)創(chuàng)新幾十年來,CPU一直用來運行一般的編程任務(wù)。它擅長于利用分支預(yù)測和亂序執(zhí)行等各種復(fù)雜技術(shù)來串行運行計算指令,從而提高速度。相反,圖形處理器(GPU)是專用加速器,最早是為了在顯示屏上同時顯示數(shù)百萬個像素而設(shè)計的。GPU通過使用較簡單的執(zhí)行流水線并行執(zhí)行計算來實現(xiàn)這個過程。以前,CPU和GPU雖然集成度越來越高,但卻是相互獨立運行。
AMD加速處理器(APU)將CPU和GPU集成配置到同一硅片上。這樣做會帶來許多優(yōu)勢,比如可以通過共享內(nèi)存接口、供電和散熱基礎(chǔ)架構(gòu)來提高效率。GPU并行執(zhí)行提高了自然用戶界面和模式識別等許多工作負(fù)載的處理效率,并且在GPU與CPU協(xié)同使用時,這些工作負(fù)載的執(zhí)行效率能夠提高數(shù)倍。優(yōu)化GPU和CPU并行操作可以最大限度地提高設(shè)備的性能,縮短任務(wù)用時,并且提高進(jìn)入節(jié)能模式的頻率。
一個長期面臨的挑戰(zhàn)是軟件開發(fā)人員難于編寫充分利用CPU和GPU的應(yīng)用程序。傳統(tǒng)上,這兩種處理器分別具備獨立的內(nèi)存系統(tǒng)。這就是說無論何時CPU想利用GPU,它都得將數(shù)據(jù)從它的內(nèi)存中復(fù)制到GPU的內(nèi)存中。這使應(yīng)用程序的編寫不僅效率低下而且困難,因此GPU一般只能用于大數(shù)據(jù)集的應(yīng)用中。此外,獨立內(nèi)存還會增加用電量,因為處理器會經(jīng)常將緩存數(shù)據(jù)在CPU和GPU之間轉(zhuǎn)移。
通過AMD最新開發(fā)的異構(gòu)統(tǒng)一內(nèi)存訪問(hUMA),CPU和GPU可以共享同一個內(nèi)存。二者可以訪問所有的平臺內(nèi)存,并且還可以將數(shù)據(jù)分配到系統(tǒng)內(nèi)存空間的任意位置。這種共享內(nèi)存架構(gòu)大大降低了編程的復(fù)雜性,其原因是軟件開發(fā)人員不用再指出數(shù)據(jù)的緩存位置,而這個操作容易出現(xiàn)錯誤,進(jìn)而會導(dǎo)致很難檢測和修復(fù)的漏洞。
統(tǒng)一內(nèi)存架構(gòu)的優(yōu)勢顯而易見,這使軟件開發(fā)人員可以流暢運用Java、C++ AMP和Python等高級語言來利用GPU的并行處理功能,從而提高性能和效率。最近的一個主流視頻和圖片編輯程序的運行結(jié)果表明,若將GPU的并行處理與CPU相呼應(yīng),最高可將某些功能的性能提高17倍。然而,由于GPU和CPU共享電源/熱基礎(chǔ)架構(gòu),電源需求與單獨使用CPU時相等。
hUMA是AMD異構(gòu)系統(tǒng)架構(gòu)(HSA)實現(xiàn)的一部分。當(dāng)按照HSA架構(gòu)設(shè)計和編程時,這樣的電源和性能提升可以擴(kuò)展到其他的固定功能設(shè)備,比如數(shù)字信號處理器(DSP)或安全處理器。
代號為“Carrizo”的AMD處理器是行業(yè)內(nèi)第一款符合異構(gòu)系統(tǒng)架構(gòu)基金會(HSA Foundation)HSA 1.0規(guī)范的處理器。該架構(gòu)大大降低了編程難度,同時提高了低功耗下的應(yīng)用性能。
高電源效率硅技術(shù)計算機(jī)工作負(fù)載的變化,將會對微處理器的用電量產(chǎn)生影響。工作負(fù)載(比如復(fù)雜的服務(wù)器事務(wù)或視頻渲染)需求越大,處理器吸取的電流越大,然后當(dāng)需求減少時,電流則會降低。電流突變會導(dǎo)致芯片供電電壓發(fā)生嚴(yán)重波動。為了解決電壓下降的問題,微處理器設(shè)計人員一般會提供大約10%~15%的額外電壓,以確保處理器電壓始終充足。但過電壓又會以能耗為代價,因為其浪費的電力與電壓增長的平方成正比(即10%的過電壓會造成20%的電力浪費)。
AMD研發(fā)了多項技術(shù)來優(yōu)化電壓。其最新的處理器配置了電壓跟蹤電路,以納秒級的精度對平均電壓與電壓下降進(jìn)行比較。通過在平均電壓下運行,然后短暫地快速降頻來抵消供電電壓的驟降,它可以恢復(fù)大部分被浪費的電力。由于頻率調(diào)整可以以納秒級的水平完成,計算性能幾乎不會受到影響,而功耗則會減少10%~20%.從“Carrizo”APU開始,CPU和GPU就都采用了自適應(yīng)電壓運算功能。
評論
查看更多