生產(chǎn)芯片,江湖卻到處都有它的傳說,這就是ARM。在手機出貨量放緩的當下,很多業(yè)內公司在尋求著新興領域的突破,ARM也是如此。同時ARM推出全新DynamIQ技術,該公司也強調:“DynamIQ技術將會被廣泛的用于人工智能和機器學習領域”。今天小編就給大伙扒一扒ARM處理器的發(fā)展歷程及技術升級之路。
ARM發(fā)展歷程
1978年12月5日,物理學家赫爾曼·豪澤(Hermann Hauser)和工程師Chris Curry,在英國劍橋創(chuàng)辦了CPU公司(Cambridge Processing Unit),主要業(yè)務是為當?shù)厥袌龉娮釉O備。1979年,CPU公司改名為Acorn計算機公司。
起初,Acorn公司打算使用摩托羅拉公司的16位芯片,但是發(fā)現(xiàn)這種芯片太慢也太貴?!耙慌_售價500英鎊的機器,不可能使用價格100英鎊的CPU!”他們轉而向Intel公司索要80286芯片的設計資料,但是遭到拒絕,于是被迫自行研發(fā)。無情的英特爾估計現(xiàn)在腸子都悔青了。
1985年,Roger Wilson和Steve Furber設計了他們自己的第一代32位、6MHz的處理器,用它做出了一臺RISC指令集的計算機,簡稱ARM(Acorn RISC Machine)。這就是ARM這個名字的由來。
1990年11月27日,Acorn公司正式改組為ARM計算機公司。蘋果公司出資150萬英鎊,芯片廠商VLSI出資25萬英鎊,Acorn本身則以150萬英鎊的知識產(chǎn)權和12名工程師入股。公司的辦公地點非常簡陋,就是一個谷倉。
公司成立后,業(yè)務一度很不景氣,工程師們人心惶惶,擔心將要失業(yè)。由于缺乏資金,ARM做出了一個意義深遠的決定:自己不制造芯片,只將芯片的設計方案授權(licensing)給其他公司,由它們來生產(chǎn)。正是這個模式,最終使得ARM芯片遍地開花,將封閉設計的Intel公司置于“人民戰(zhàn)爭”的汪洋大海。
20世紀90年代,ARM公司的業(yè)績平平,處理器的出貨量徘徊不前。但是進入21世紀之后,由于手機的快速發(fā)展,出貨量呈現(xiàn)爆炸式增長,ARM處理器占領了全球手機市場。
經(jīng)過12年的發(fā)展,在2002年,ARM架構芯片的出貨量正式突破10億。隨著智能設備的爆炸式成長,如今,要完成10億片的出貨量只需要一個月。
2004年,Cortex系列的誕生是ARM公司的大事件,從此該公司不再用數(shù)字為處理器命名。它分為A、R和M三類,旨在為各種不同的市場提供服務。
2006年,全球ARM芯片出貨量為20億片,2010年預計將達到45億片。
2015年,ARM基于ARMv8架構推出了一種面向企業(yè)級市場的新平臺標準。此外,他們還開始在物聯(lián)網(wǎng)領域發(fā)力。同年,福布斯雜志將ARM評為世界上五大最具創(chuàng)新力的公司之一。
如今ARM已經(jīng)被軟銀收購,孫正義也瞬間變成2016超級“網(wǎng)紅”,還揚言要制霸物聯(lián)網(wǎng)時代。果然,吸一口ARM“純氧”,瞬間精氣神都不一樣了。
ARM處理器經(jīng)歷的技術變革
一、32位處理器時代
在32位處理器之前是16位處理器,起初,Acorn公司打算使用摩托羅拉公司的16位芯片,但是發(fā)現(xiàn)這種芯片太慢也太貴?!耙慌_售價500英鎊的機器,不可能使用價格100英鎊的CPU!”1985年,Roger Wilson和Steve Furber設計了他們自己的第一代32位、6MHz的處理器,用它做出了一臺RISC指令集的計算機,簡稱ARM(Acorn RISC Machine)。這就是ARM這個名字的由來。
Acorn公司正式改組為ARM計算機公司是在1990年11月27日。
在此之前,也就是1985年,ARMv1架構誕生,該版架構只在原型機ARM1出現(xiàn)過,只有26位的尋址空間(64MB),沒有用于商業(yè)產(chǎn)品。第二年,ARMv2架構誕生,首顆量產(chǎn)的ARM處理器ARM2就是基于該架構,包含了對32位乘法指令和協(xié)處理器指令的支持,但同樣仍為26位尋址空間。其后還出現(xiàn)了變種ARMv2a,ARM3即采用了ARMv2a,是第一片采用片上Cache的ARM處理器。
1990年,ARMv3架構誕生,第一個采用ARMv3架構的微處理器是ARM6(610)以及ARM7,其具有片上高速緩存、MMU和寫緩沖,尋址空間增大到32位(4GB)。
1993年,ARMv4架構誕生,這個架構被廣泛使用,ARM7(7TDMI)、ARM8、ARM9(9TDMI)和StrongARM采用了該架構。ARM在這個系列中引入了T變種指令集,即處理器可工作在Thumb狀態(tài),增加了16位Thumb指令集。
1998年,ARMv5架構誕生,ARM7(EJ)、ARM9(E)、ARM10(E)和Xscale采用了該架構,這版架構改進了ARM/Thumb狀態(tài)之間的切換效率。此外還引入了DSP指令和支持Java。
2001年,ARMv6架構誕生,ARM11采用的是該架構,這版架構強化了圖形處理性能。通過追加有效進行多媒體處理的SIMD將語音及圖像的處理功能大大提高。此外ARM在這個系列中引入了混合16位/32位的Thumb-2指令集。
2004年,ARMv7架構誕生,從這個時候開始ARM以Cortex來重新命名處理器,Cortex-M3/4/7,Cortex-R4/5/6/7,Cortex-A8/9/5/7/15/17都是基于該架構。該架構包括NEON技術擴展,可將DSP和媒體處理吞吐量提升高達400%,并提供改進的浮點支持以滿足下一代3D圖形和游戲以及傳統(tǒng)嵌入式控制應用的需要。
2007年,在ARMv6基礎上衍生了ARMv6-M架構,該架構是專門為低成本、高性能設備而設計,向以前由8位設備占主導地位的市場提供32位功能強大的解決方案。Cortex-M0/1/0+即采用的該架構。
二、64位處理器
2011年,ARM宣布了自己的第一個64位指令集處理器架構“ARMv8”,該架構基于32位的ARMv7而來,并保留了TrustZone安全執(zhí)行環(huán)境、虛擬化、NEON(高級SIMD)等關鍵技術特性。ARM宣稱,ARMv8新架構將把高能效的64位計算帶入高端服務器等新的領域,并提供向下兼容性,便于現(xiàn)有軟件的移植,誓有一股挑戰(zhàn)英特爾的姿勢。
當時是基于怎樣的市場需求和歷史背景呢?
隨著設備的發(fā)展和新技術——語音識別、3D游戲和高分辨率顯示屏——逐漸普及,32位處理器的能力已經(jīng)漸漸被推到了極限。ARM看到了64位節(jié)能處理器的需求,并在正式發(fā)布ARMv8-A架構。
ARM上64位計算的好處并不僅限于智能手機和平板電腦。ARM的生態(tài)系統(tǒng)很廣闊,他們的處理器也被許多不同類型的設備所使用。服務器市場是ARM處理器影響力有限的一個領域。信息時代的發(fā)展讓維持數(shù)據(jù)中心所消耗的能源持續(xù)快速增長,而任何能夠降低能源使用的技術都是對于資金和自然資源的節(jié)省。除了節(jié)能之外,在服務器當中使用64位ARM芯片還有其他的好處。這些服務器都會被動散熱,這意味著你可以將它們集中在一起,而無需擔心會發(fā)生過熱的情況。這樣一來,用于散熱上的花費也將有所降低。
蘋果憑借著iPhone 5s的全新64位A7處理器震驚了整個移動領域。A7采用了蘋果設計的ARMv8雙核處理器,名為Cyclone。它使用了兩個64KB L1緩存(供兩個核心分別使用),一個1MB L2緩存(被兩個核心所分享)和一個4MB L3緩存(為整個SoC所用)。
至于服務器軟件,Linux這樣的操作系統(tǒng)已經(jīng)是64位的了,其主線內核當中也已經(jīng)加入了對于ARMv8的支持。這也就是說,制作運行于64位Linux、ARM處理器的服務器并不會很困難。
最后總結一句話,多虧了ARM,64位的移動計算時代就要到來了。這些新的處理器不僅速度更快,還為移動平臺開啟了更多的可能性。
大小核(big.LITTLE)芯片設計架構
在ARM推出旗下首款64位構架ARMv8的同一年,該公司還推出了big.LITTLE技術,制造商可利用該技術將高性能核心與節(jié)能核心結合起來,并用軟件控制核心間的無縫切換,以達到省電的目的。它解決了當今行業(yè)面臨的一個難題:如何創(chuàng)建既有高性能又有極佳節(jié)能效果的片上系統(tǒng) (SoC) 以延長電池使用壽命。
大小核設計到底是什么原理呢?
為此,ARM專門錄制了一個視頻,深入淺出地做出解釋,并用兩個人來分別代表big.LITTLE架構中的“角色”,身材魁梧高大的男士是big,身材嬌小的是LITTLE,如下圖。
基于big.LITTLE技術的八核處理器,并沒有將傳統(tǒng)內核放在單一的處理器上,而是一分為二,其中一個使用了4個“小核心”,另一個則使用了4個“大核心”,這兩個“核心”都有著自己獨立的速度和性能。通過兩大核心自主運行,搭載big.LITTLE技術的處理器比之前的手機CPU更加高效,畢竟后者只有一個或者兩個內核。
當需要用智能手機打開一個網(wǎng)頁時,手機就可以用一個大的內核來處理該任務,而小的內核則同時處理其他小任務,比如查看電子郵件、撥打電話等。當手機不需要工作時,big核心和LITTLE核心都可以停下來休息。
三星Exynos 5 Octa八核移動處理器是采用Big.Little結構的第一款CPU。該芯片其實是由兩顆四核處理器封裝在一起。一顆 1.8GHz 的 Cortex-A15 架構的四核處理器和一顆 1.2GHz Cortex-A7 架構的四核處理器。據(jù)三星解釋,高性能的處理器將用來處理更加復雜的運算,平時一般使用的時候則采用低性能的處理器,兩者可以根據(jù)使用情況不同進行協(xié)同, 因此也能有效降低功耗。Exynos 5 Octa采用了28納米的制作工藝,號稱功耗比市面上的四核處理器降低了70%,但是性能卻提升了2倍之多。
三、DynamIQ技術
2017年3月21日下午,ARM在北京金隅喜來登酒店召開發(fā)布會,正式發(fā)布了全新的有針對人工智能及機器學習進行優(yōu)化的DynamIQ技術,而這項技術也將作為未來下一代ARM Cortex-A系列處理器的基礎。這一技術也被稱為big.LITTLE技術的重要演進。
但他到底是個什么鬼?
原有的big.LITTLE技術是將多個大核組成一個計算集群、多個小核組成另一個計算集群,然后進行協(xié)作運行。而全新的DynamIQ big.LITTLE將允許在單一計算集群上進行大小核配置,可以出現(xiàn)比如1+3、1+7、3+5等諸多類型(目前最多可以支持配置8核),將可配置性提升到了一個新的臺階。同時,DynamIQ big.LITTLE還可以對每一個處理器進行獨立的頻率控制以及開、關、休眠狀態(tài)的控制,可以實現(xiàn)高效的、無縫的在不同任務間切換最合適的處理器。
此外,DynamIQ還對內存子系統(tǒng)進行了重新設計,可以對內存進行更細顆粒度的管理,實現(xiàn)更快的數(shù)據(jù)讀取和全新的節(jié)能特性。
在該技術的發(fā)布會上,ARM副總裁表示,未來將會推出基于DynamIQ技術的大小核。而且2018年,就會有相應的終端出現(xiàn)。DynamIQ技術將會率先被用在智能手機領域,此外也將會進入汽車、嵌入式領域、企業(yè)級市場等。
然則,ARM的這步棋更多針對的是人工智能這一領域,首先人工智能對于大小核之間的調配、無縫切換都要求很高,但全新的DynamIQ big.LITTLE架構是非常適合的,將會為機器學習和人工智能應用帶來更快的響應速度。
其次,DynamIQ還特別加入了針對人工智能的指令集和優(yōu)化庫,下一代ARMV8.2版本的指令集將支持神經(jīng)網(wǎng)路卷積運算,可以極大的提升人工智能和機器學習的效率。
據(jù)ARM透露,針對人工智能和機器學習的全新處理器指令集在采用DynamIQ技術的Cortex-A系列處理器在優(yōu)化應用后,可實現(xiàn)比基于現(xiàn)有的Cortex-A73的設備高50倍的人工智能性能,并最多可提升10倍CPU與SoC上指定硬件加速器之間的反應速度。
ARM的誕生可能存在著一些無奈,但這并不妨礙ARM靠自己獨特的授權方式搜刮市場。以低功耗和高性能賺得盆滿缽滿,最新的DynamIQ技術也試圖霸占人工智能領域,新興領域的風口似乎已經(jīng)打開,ARM有著非常不錯的底子,再加上被軟銀收購,未來還是非常令人期待的。
-
處理器
+關注
關注
68文章
19286瀏覽量
229852 -
ARM處理器
+關注
關注
6文章
360瀏覽量
41746
發(fā)布評論請先 登錄
相關推薦
評論