亚洲a∨好看av高清在线观看,久久亚洲私人国产精品VA

PCIe總線概述

隨著現(xiàn)代處理器技術(shù)的發(fā)展，在互連領(lǐng)域中，使用高速差分總線替代并行總線是大勢所趨。與單端并行信號(hào)相比，高速差分信號(hào)可以使用更高的時(shí)鐘頻率，從而使用更少的信號(hào)線，完成之前需要許多單端并行數(shù)據(jù)信號(hào)才能達(dá)到的總線帶寬。

PCI總線使用并行總線結(jié)構(gòu)，在同一條總線上的所有外部設(shè)備共享總線帶寬，而PCIe總線使用了高速差分總線，并采用端到端的連接方式，因此在每一條PCIe鏈路中只能連接兩個(gè)設(shè)備。這使得PCIe與PCI總線采用的拓?fù)浣Y(jié)構(gòu)有所不同。PCIe總線除了在連接方式上與PCI總線不同之外，還使用了一些在網(wǎng)絡(luò)通信中使用的技術(shù)，如支持多種數(shù)據(jù)路由方式，基于多通路的數(shù)據(jù)傳遞方式，和基于報(bào)文的數(shù)據(jù)傳送方式，并充分考慮了在數(shù)據(jù)傳送中出現(xiàn)服務(wù)質(zhì)量QoS (Quality of Service)問題。

PCIe總線的基礎(chǔ)知識(shí)

與PCI總線不同，PCIe總線使用端到端的連接方式，在一條PCIe鏈路的兩端只能各連接一個(gè)設(shè)備，這兩個(gè)設(shè)備互為是數(shù)據(jù)發(fā)送端和數(shù)據(jù)接收端。PCIe總線除了總線鏈路外，還具有多個(gè)層次，發(fā)送端發(fā)送數(shù)據(jù)時(shí)將通過這些層次，而接收端接收數(shù)據(jù)時(shí)也使用這些層次。PCIe總線使用的層次結(jié)構(gòu)與網(wǎng)絡(luò)協(xié)議棧較為類似。

1.1 端到端的數(shù)據(jù)傳遞

PCIe鏈路使用“端到端的數(shù)據(jù)傳送方式”，發(fā)送端和接收端中都含有TX(發(fā)送邏輯)和RX(接收邏輯)，其結(jié)構(gòu)如圖41所示。

由上圖所示，在PCIe總線的物理鏈路的一個(gè)數(shù)據(jù)通路(Lane)中，由兩組差分信號(hào)，共4根信號(hào)線組成。其中發(fā)送端的TX部件與接收端的RX部件使用一組差分信號(hào)連接，該鏈路也被稱為發(fā)送端的發(fā)送鏈路，也是接收端的接收鏈路；而發(fā)送端的RX部件與接收端的TX部件使用另一組差分信號(hào)連接，該鏈路也被稱為發(fā)送端的接收鏈路，也是接收端的發(fā)送鏈路。一個(gè)PCIe鏈路可以由多個(gè)Lane組成。

高速差分信號(hào)電氣規(guī)范要求其發(fā)送端串接一個(gè)電容，以進(jìn)行AC 耦合。該電容也被稱為AC耦合電容。PCIe鏈路使用差分信號(hào)進(jìn)行數(shù)據(jù)傳送，一個(gè)差分信號(hào)由D+和D-兩根信號(hào)組成，信號(hào)接收端通過比較這兩個(gè)信號(hào)的差值，判斷發(fā)送端發(fā)送的是邏輯“1”還是邏輯“0”。

與單端信號(hào)相比，差分信號(hào)抗干擾的能力更強(qiáng)，因?yàn)椴罘中盘?hào)在布線時(shí)要求“等長”、“等寬”、“貼近”，而且在同層。因此外部干擾噪聲將被“同值”而且“同時(shí)”加載到D+和D-兩根信號(hào)上，其差值在理想情況下為0，對(duì)信號(hào)的邏輯值產(chǎn)生的影響較小。因此差分信號(hào)可以使用更高的總線頻率。

此外使用差分信號(hào)能有效抑制電磁干擾EMI(Electro Magnetic Interference)。由于差分信號(hào)D+與D-距離很近而且信號(hào)幅值相等、極性相反。這兩根線與地線間耦合電磁場的幅值相等，將相互抵消，因此差分信號(hào)對(duì)外界的電磁干擾較小。當(dāng)然差分信號(hào)的缺點(diǎn)也是顯而易見的，一是差分信號(hào)使用兩根信號(hào)傳送一位數(shù)據(jù)；二是差分信號(hào)的布線相對(duì)嚴(yán)格一些。

PCIe鏈路可以由多條Lane組成，目前PCIe鏈路可以支持1、2、4、8、12、16和32個(gè)Lane，即×1、×2、×4、×8、×12、×16和×32寬度的PCIe鏈路。每一個(gè)Lane上使用的總線頻率與PCIe總線使用的版本相關(guān)。

第1個(gè)PCIe總線規(guī)范為V1.0，之后依次為V1.0a，V1.1，V2.0和V2.1。目前PCIe總線的最新規(guī)范為V2.1，而V3.0正在開發(fā)過程中，預(yù)計(jì)在2010年發(fā)布。不同的PCIe總線規(guī)范所定義的總線頻率和鏈路編碼方式并不相同，如表41所示。

表41 PCIe總線規(guī)范與總線頻率和編碼的關(guān)系

如上表所示，不同的PCIe總線規(guī)范使用的總線頻率并不相同，其使用的數(shù)據(jù)編碼方式也不相同。PCIe總線V1.x和V2.0規(guī)范在物理層中使用8/10b編碼，即在PCIe鏈路上的10 bit中含有8 bit的有效數(shù)據(jù)；而V3.0規(guī)范使用128/130b編碼方式，即在PCIe鏈路上的130 bit中含有128 bit的有效數(shù)據(jù)。

由上表所示，V3.0規(guī)范使用的總線頻率雖然只有4GHz，但是其有效帶寬是V2.x的兩倍。下文將以V2.x規(guī)范為例，說明不同寬度PCIe鏈路所能提供的峰值帶寬，如表42所示。

表42 PCIe總線的峰值帶寬

由上表所示，×32的PCIe鏈路可以提供160GT/s的鏈路帶寬，遠(yuǎn)高于PCI/PCI-X總線所能提供的峰值帶寬。而即將推出的PCIe V3.0規(guī)范使用4GHz的總線頻率，將進(jìn)一步提高PCIe鏈路的峰值帶寬。

在PCIe總線中，使用GT(Gigatransfer)計(jì)算PCIe鏈路的峰值帶寬。GT是在PCIe鏈路上傳遞的峰值帶寬，其計(jì)算公式為總線頻率×數(shù)據(jù)位寬×2。

在PCIe總線中，影響有效帶寬的因素有很多，因而其有效帶寬較難計(jì)算。盡管如此，PCIe總線提供的有效帶寬還是遠(yuǎn)高于PCI總線。PCIe總線也有其弱點(diǎn)，其中最突出的問題是傳送延時(shí)。

PCIe鏈路使用串行方式進(jìn)行數(shù)據(jù)傳送，然而在芯片內(nèi)部，數(shù)據(jù)總線仍然是并行的，因此PCIe鏈路接口需要進(jìn)行串并轉(zhuǎn)換，這種串并轉(zhuǎn)換將產(chǎn)生較大的延時(shí)。除此之外PCIe總線的數(shù)據(jù)報(bào)文需要經(jīng)過事務(wù)層、數(shù)據(jù)鏈路層和物理層，這些數(shù)據(jù)報(bào)文在穿越這些層次時(shí)，也將帶來延時(shí)。

在基于PCIe總線的設(shè)備中，×1的PCIe鏈路最為常見，而×12的PCIe鏈路極少出現(xiàn)，×4和×8的PCIe設(shè)備也不多見。Intel通常在ICH中集成了多個(gè)×1的PCIe鏈路用來連接低速外設(shè)，而在MCH中集成了一個(gè)×16的PCIe鏈路用于連接顯卡控制器。而PowerPC處理器通常能夠支持×8、×4、×2和×1的PCIe鏈路。

PCIe總線物理鏈路間的數(shù)據(jù)傳送使用基于時(shí)鐘的同步傳送機(jī)制，但是在物理鏈路上并沒有時(shí)鐘線，PCIe總線的接收端含有時(shí)鐘恢復(fù)模塊CDR(Clock Data Recovery)，CDR將從接收報(bào)文中提取接收時(shí)鐘，從而進(jìn)行同步數(shù)據(jù)傳遞。

值得注意的是，在一個(gè)PCIe設(shè)備中除了需要從報(bào)文中提取時(shí)鐘外，還使用了REFCLK+和REFCLK-信號(hào)對(duì)作為本地參考時(shí)鐘，這個(gè)信號(hào)對(duì)的描述見下文。

1.2 PCIe總線使用的信號(hào)

PCIe設(shè)備使用兩種電源信號(hào)供電，分別是Vcc與Vaux，其額定電壓為3.3V。其中Vcc為主電源，PCIe設(shè)備使用的主要邏輯模塊均使用Vcc供電，而一些與電源管理相關(guān)的邏輯使用Vaux供電。在PCIe設(shè)備中，一些特殊的寄存器通常使用Vaux供電，如Sticky Register，此時(shí)即使PCIe設(shè)備的Vcc被移除，這些與電源管理相關(guān)的邏輯狀態(tài)和這些特殊寄存器的內(nèi)容也不會(huì)發(fā)生改變。

在PCIe總線中，使用Vaux的主要原因是為了降低功耗和縮短系統(tǒng)恢復(fù)時(shí)間。因?yàn)閂aux在多數(shù)情況下并不會(huì)被移除，因此當(dāng)PCIe設(shè)備的Vcc恢復(fù)后，該設(shè)備不用重新恢復(fù)使用Vaux供電的邏輯，從而設(shè)備可以很快地恢復(fù)到正常工作狀狀態(tài)。

PCIe鏈路的最大寬度為×32，但是在實(shí)際應(yīng)用中，×32的鏈路寬度極少使用。在一個(gè)處理器系統(tǒng)中，一般提供×16的PCIe插槽，并使用PETp0~15、PETn0~15和PERp0~15、PERn0~15共64根信號(hào)線組成32對(duì)差分信號(hào)，其中16對(duì)PETxx信號(hào)用于發(fā)送鏈路，另外16對(duì)PERxx信號(hào)用于接收鏈路。除此之外PCIe總線還使用了下列輔助信號(hào)。

1 PERST#信號(hào)

該信號(hào)為全局復(fù)位信號(hào)，由處理器系統(tǒng)提供，處理器系統(tǒng)需要為PCIe插槽和PCIe設(shè)備提供該復(fù)位信號(hào)。PCIe設(shè)備使用該信號(hào)復(fù)位內(nèi)部邏輯。當(dāng)該信號(hào)有效時(shí)，PCIe設(shè)備將進(jìn)行復(fù)位操作。PCIe總線定義了多種復(fù)位方式，其中Cold Reset和Warm Reset這兩種復(fù)位方式的實(shí)現(xiàn)與該信號(hào)有關(guān)，詳見第1.5節(jié)。

2 REFCLK+和REFCLK-信號(hào)

在一個(gè)處理器系統(tǒng)中，可能含有許多PCIe設(shè)備，這些設(shè)備可以作為Add-In卡與PCIe插槽連接，也可以作為內(nèi)置模塊，與處理器系統(tǒng)提供的PCIe鏈路直接相連，而不需要經(jīng)過PCIe插槽。PCIe設(shè)備與PCIe插槽都具有REFCLK+和REFCLK-信號(hào)，其中PCIe插槽使用這組信號(hào)與處理器系統(tǒng)同步。

在一個(gè)處理器系統(tǒng)中，通常采用專用邏輯向PCIe插槽提供REFCLK+和REFCLK-信號(hào)，如圖42所示。其中100Mhz的時(shí)鐘源由晶振提供，并經(jīng)過一個(gè)“一推多”的差分時(shí)鐘驅(qū)動(dòng)器生成多個(gè)同相位的時(shí)鐘源，與PCIe插槽一一對(duì)應(yīng)連接。

PCIe插槽需要使用參考時(shí)鐘，其頻率范圍為100MHz±300ppm。處理器系統(tǒng)需要為每一個(gè)PCIe插槽、MCH、ICH和Switch提供參考時(shí)鐘。而且要求在一個(gè)處理器系統(tǒng)中，時(shí)鐘驅(qū)動(dòng)器產(chǎn)生的參考時(shí)鐘信號(hào)到每一個(gè)PCIe插槽(MCH、ICH和Swith)的距離差在15英寸之內(nèi)。通常信號(hào)的傳播速度接近光速，約為6英寸/ns，由此可見，不同PCIe插槽間REFCLK+和REFCLK-信號(hào)的傳送延時(shí)差約為2.5ns。

當(dāng)PCIe設(shè)備作為Add-In卡連接在PCIe插槽時(shí)，可以直接使用PCIe插槽提供的REFCLK+和REFCLK-信號(hào)，也可以使用獨(dú)立的參考時(shí)鐘，只要這個(gè)參考時(shí)鐘在100MHz±300ppm范圍內(nèi)即可。內(nèi)置的PCIe設(shè)備與Add-In卡在處理REFCLK+和REFCLK-信號(hào)時(shí)使用的方法類似，但是PCIe設(shè)備可以使用獨(dú)立的參考時(shí)鐘，而不使用REFCLK+和REFCLK-信號(hào)。

在PCIe設(shè)備配置空間的Link Control Register中，含有一個(gè)“Common Clock Configuration”位。當(dāng)該位為1時(shí)，表示該設(shè)備與PCIe鏈路的對(duì)端設(shè)備使用“同相位”的參考時(shí)鐘；如果為0，表示該設(shè)備與PCIe鏈路的對(duì)端設(shè)備使用的參考時(shí)鐘是異步的。

在PCIe設(shè)備中，“Common Clock Configuration”位的缺省值為0，此時(shí)PCIe設(shè)備使用的參考時(shí)鐘與對(duì)端設(shè)備沒有任何聯(lián)系，PCIe鏈路兩端設(shè)備使用的參考時(shí)鐘可以異步設(shè)置。這個(gè)異步時(shí)鐘設(shè)置方法對(duì)于使用PCIe鏈路進(jìn)行遠(yuǎn)程連接時(shí)尤為重要。

在一個(gè)處理器系統(tǒng)中，如果使用PCIe鏈路進(jìn)行機(jī)箱到機(jī)箱間的互連，因?yàn)閰⒖紩r(shí)鐘可以異步設(shè)置，機(jī)箱到機(jī)箱之間進(jìn)行數(shù)據(jù)傳送時(shí)僅需要差分信號(hào)線即可，而不需要參考時(shí)鐘，從而極大降低了連接難度。

3 WAKE#信號(hào)

當(dāng)PCIe設(shè)備進(jìn)入休眠狀態(tài)，主電源已經(jīng)停止供電時(shí)，PCIe設(shè)備使用該信號(hào)向處理器系統(tǒng)提交喚醒請求，使處理器系統(tǒng)重新為該P(yáng)CIe設(shè)備提供主電源Vcc。在PCIe總線中，WAKE#信號(hào)是可選的，因此使用WAKE#信號(hào)喚醒PCIe設(shè)備的機(jī)制也是可選的。值得注意的是產(chǎn)生該信號(hào)的硬件邏輯必須使用輔助電源Vaux供電。

WAKE#是一個(gè)Open Drain信號(hào)，一個(gè)處理器的所有PCIe設(shè)備可以將WAKE#信號(hào)進(jìn)行線與后，統(tǒng)一發(fā)送給處理器系統(tǒng)的電源控制器。當(dāng)某個(gè)PCIe設(shè)備需要被喚醒時(shí)，該設(shè)備首先置WAKE#信號(hào)有效，然后在經(jīng)過一段延時(shí)之后，處理器系統(tǒng)開始為該設(shè)備提供主電源Vcc，并使用PERST#信號(hào)對(duì)該設(shè)備進(jìn)行復(fù)位操作。此時(shí)WAKE#信號(hào)需要始終保持為低，當(dāng)主電源Vcc上電完成之后，PERST#信號(hào)也將置為無效并結(jié)束復(fù)位，WAKE#信號(hào)也將隨之置為無效，結(jié)束整個(gè)喚醒過程。

PCIe設(shè)備除了可以使用WAKE#信號(hào)實(shí)現(xiàn)喚醒功能外，還可以使用Beacon信號(hào)實(shí)現(xiàn)喚醒功能。與WAKE#信號(hào)實(shí)現(xiàn)喚醒功能不同，Beacon使用In-band信號(hào)，即差分信號(hào)D+和D-實(shí)現(xiàn)喚醒功能。Beacon信號(hào)DC平衡，由一組通過D+和D-信號(hào)生成的脈沖信號(hào)組成。這些脈沖信號(hào)寬度的最小值為2ns，最大值為16us。當(dāng)PCIe設(shè)備準(zhǔn)備退出L2狀態(tài)(該狀態(tài)為PCIe設(shè)備使用的一種低功耗狀態(tài))時(shí)，可以使用Beacon信號(hào)，提交喚醒請求。

4 SMCLK和SMDAT信號(hào)

SMCLK和SMDAT信號(hào)與x86處理器的SMBus(System Mangement Bus)相關(guān)。SMBus于1995年由Intel提出，SMBus由SMCLK和SMDAT信號(hào)組成。SMBus源于I2C總線，但是與I2C總線存在一些差異。

SMBus的最高總線頻率為100KHz，而I2C總線可以支持400KHz和2MHz的總線頻率。此外SMBus上的從設(shè)備具有超時(shí)功能，當(dāng)從設(shè)備發(fā)現(xiàn)主設(shè)備發(fā)出的時(shí)鐘信號(hào)保持低電平超過35ms時(shí)，將引發(fā)從設(shè)備的超時(shí)復(fù)位。在正常情況下，SMBus的主設(shè)備使用的總線頻率最低為10KHz，以避免從設(shè)備在正常使用過程中出現(xiàn)超時(shí)。

在SMbus中，如果主設(shè)備需要復(fù)位從設(shè)備時(shí)，可以使用這種超時(shí)機(jī)制。而I2C總線只能使用硬件信號(hào)才能實(shí)現(xiàn)這種復(fù)位操作，在I2C總線中，如果從設(shè)備出現(xiàn)錯(cuò)誤時(shí)，單純通過主設(shè)備是無法復(fù)位從設(shè)備的。

SMBus還支持Alert Response機(jī)制。當(dāng)從設(shè)備產(chǎn)生一個(gè)中斷時(shí)，并不會(huì)立即清除該中斷，直到主設(shè)備向0b0001100地址發(fā)出命令。

上文所述的SMBus和I2C總線的區(qū)別還是局限于物理層和鏈路層上，實(shí)際上SMBus還含有網(wǎng)絡(luò)層。SMBus還在網(wǎng)絡(luò)層上定義了11種總線協(xié)議，用來實(shí)現(xiàn)報(bào)文傳遞。

SMBus在x86處理器系統(tǒng)中得到了大規(guī)模普及，其主要作用是管理處理器系統(tǒng)的外部設(shè)備，并收集外設(shè)的運(yùn)行信息，特別是一些與智能電源管理相關(guān)的信息。PCI和PCIe插槽也為SMBus預(yù)留了接口，以便于PCI/PCIe設(shè)備與處理器系統(tǒng)進(jìn)行交互。

在Linux系統(tǒng)中，SMBus得到了廣泛的應(yīng)用，ACPI也為SMBus定義了一系列命令，用于智能電池、電池充電器與處理器系統(tǒng)之間的通信。在Windows操作系統(tǒng)中，有關(guān)外部設(shè)備的描述信息，也是通過SMBus獲得的。

5 JTAG信號(hào)

JTAG(Joint Test Action Group)是一種國際標(biāo)準(zhǔn)測試協(xié)議，與IEEE 1149.1兼容，主要用于芯片內(nèi)部測試。目前絕大多數(shù)器件都支持JTAG測試標(biāo)準(zhǔn)。JTAG信號(hào)由TRST#、TCK、TDI、TDO和TMS信號(hào)組成。其中TRST#為復(fù)位信號(hào)；TCK為時(shí)鐘信號(hào)；TDI和TDO分別與數(shù)據(jù)輸入和數(shù)據(jù)輸出對(duì)應(yīng)；而TMS信號(hào)為模式選擇。

JTAG允許多個(gè)器件通過JTAG接口串聯(lián)在一起，并形成一個(gè)JTAG鏈。目前FPGA和EPLD可以借用JTAG接口實(shí)現(xiàn)在線編程ISP(In-System Programming)功能。處理器也可以使用JTAG接口進(jìn)行系統(tǒng)級(jí)調(diào)試工作，如設(shè)置斷點(diǎn)、讀取內(nèi)部寄存器和存儲(chǔ)器等一系列操作。除此之外JTAG接口也可用作“逆向工程”，分析一個(gè)產(chǎn)品的實(shí)現(xiàn)細(xì)節(jié)，因此在正式產(chǎn)品中，一般不保留JTAG接口。

6 PRSNT1#和PRSNT2#信號(hào)

PRSNT1#和PRSNT2#信號(hào)與PCIe設(shè)備的熱插拔相關(guān)。在基于PCIe總線的Add-in卡中，PRSNT1#和PRSNT2#信號(hào)直接相連，而在處理器主板中，PRSNT1#信號(hào)接地，而PRSNT2#信號(hào)通過上拉電阻接為高。PCIe設(shè)備的熱插拔結(jié)構(gòu)如圖43所示。

如上圖所示，當(dāng)Add-In卡沒有插入時(shí)，處理器主板的PRSNT2#信號(hào)由上拉電阻接為高，而當(dāng)Add-In卡插入時(shí)主板的PRSNT2#信號(hào)將與PRSNT1#信號(hào)通過Add-In卡連通，此時(shí)PRSNT2#信號(hào)為低。處理器主板的熱插拔控制邏輯將捕獲這個(gè)“低電平”，得知Add-In卡已經(jīng)插入，從而觸發(fā)系統(tǒng)軟件進(jìn)行相應(yīng)地處理。

Add-In卡拔出的工作機(jī)制與插入類似。當(dāng)Add-in卡連接在處理器主板時(shí)，處理器主板的PRSNT2#信號(hào)為低，當(dāng)Add-In卡拔出后，處理器主板的PRSNT2#信號(hào)為高。處理器主板的熱插拔控制邏輯將捕獲這個(gè)“高電平”，得知Add-In卡已經(jīng)被拔出，從而觸發(fā)系統(tǒng)軟件進(jìn)行相應(yīng)地處理。

不同的處理器系統(tǒng)處理PCIe設(shè)備熱拔插的過程并不相同，在一個(gè)實(shí)際的處理器系統(tǒng)中，熱拔插設(shè)備的實(shí)現(xiàn)也遠(yuǎn)比圖43中的示例復(fù)雜得多。值得注意的是，在實(shí)現(xiàn)熱拔插功能時(shí)，Add-in Card需要使用“長短針”結(jié)構(gòu)。

如圖43所示，PRSNT1#和PRSNT2#信號(hào)使用的金手指長度是其他信號(hào)的一半。因此當(dāng)PCIe設(shè)備插入插槽時(shí)，PRSNT1#和PRSNT2#信號(hào)在其他金手指與PCIe插槽完全接觸，并經(jīng)過一段延時(shí)后，才能與插槽完全接觸；當(dāng)PCIe設(shè)備從PCIe插槽中拔出時(shí)，這兩個(gè)信號(hào)首先與PCIe插槽斷連，再經(jīng)過一段延時(shí)后，其他信號(hào)才能與插槽斷連。系統(tǒng)軟件可以使用這段延時(shí)，進(jìn)行一些熱拔插處理。

1.3 PCLe總線的層次結(jié)構(gòu)

PCIe總線采用了串行連接方式，并使用數(shù)據(jù)包(Packet)進(jìn)行數(shù)據(jù)傳輸，采用這種結(jié)構(gòu)有效去除了在PCI總線中存在的一些邊帶信號(hào)，如INTx和PME#等信號(hào)。在PCIe總線中，數(shù)據(jù)報(bào)文在接收和發(fā)送過程中，需要通過多個(gè)層次，包括事務(wù)層、數(shù)據(jù)鏈路層和物理層。PCIe總線的層次結(jié)構(gòu)如圖44所示。

PCIe總線的層次組成結(jié)構(gòu)與網(wǎng)絡(luò)中的層次結(jié)構(gòu)有類似之處，但是PCIe總線的各個(gè)層次都是使用硬件邏輯實(shí)現(xiàn)的。在PCIe體系結(jié)構(gòu)中，數(shù)據(jù)報(bào)文首先在設(shè)備的核心層(Device Core)中產(chǎn)生，然后再經(jīng)過該設(shè)備的事務(wù)層(Transaction Layer)、數(shù)據(jù)鏈路層(Data Link Layer)和物理層(Physical Layer)，最終發(fā)送出去。而接收端的數(shù)據(jù)也需要通過物理層、數(shù)據(jù)鏈路和事務(wù)層，并最終到達(dá)Device Core。

1 事務(wù)層

事務(wù)層定義了PCIe總線使用總線事務(wù)，其中多數(shù)總線事務(wù)與PCI總線兼容。這些總線事務(wù)可以通過Switch等設(shè)備傳送到其他PCIe設(shè)備或者RC。RC也可以使用這些總線事務(wù)訪問PCIe設(shè)備。

事務(wù)層接收來自PCIe設(shè)備核心層的數(shù)據(jù)，并將其封裝為TLP(Transaction Layer Packet)后，發(fā)向數(shù)據(jù)鏈路層。此外事務(wù)層還可以從數(shù)據(jù)鏈路層中接收數(shù)據(jù)報(bào)文，然后轉(zhuǎn)發(fā)至PCIe設(shè)備的核心層。

事務(wù)層的一個(gè)重要工作是處理PCIe總線的“序”。在PCIe總線中，“序”的概念非常重要，也較難理解。在PCIe總線中，事務(wù)層傳遞報(bào)文時(shí)可以亂序，這為PCIe設(shè)備的設(shè)計(jì)制造了不小的麻煩。事務(wù)層還使用流量控制機(jī)制保證PCIe鏈路的使用效率。有關(guān)事務(wù)層的詳細(xì)說明見第6章。

2 數(shù)據(jù)鏈路層

數(shù)據(jù)鏈路層保證來自發(fā)送端事務(wù)層的報(bào)文可以可靠、完整地發(fā)送到接收端的數(shù)據(jù)鏈路層。來自事務(wù)層的報(bào)文在通過數(shù)據(jù)鏈路層時(shí)，將被添加Sequence Number前綴和CRC后綴。數(shù)據(jù)鏈路層使用ACK/NAK協(xié)議保證報(bào)文的可靠傳遞。

PCIe總線的數(shù)據(jù)鏈路層還定義了多種DLLP(Data Link Layer Packet)，DLLP產(chǎn)生于數(shù)據(jù)鏈路層，終止于數(shù)據(jù)鏈路層。值得注意的是，TLP與DLLP并不相同，DLLP并不是由TLP加上Sequence Number前綴和CRC后綴組成的。

3 物理層

物理層是PCIe總線的最底層，將PCIe設(shè)備連接在一起。PCIe總線的物理電氣特性決定了PCIe鏈路只能使用端到端的連接方式。PCIe總線的物理層為PCIe設(shè)備間的數(shù)據(jù)通信提供傳送介質(zhì)，為數(shù)據(jù)傳送提供可靠的物理環(huán)境。

物理層是PCIe體系結(jié)構(gòu)最重要，也是最難以實(shí)現(xiàn)的組成部分。PCIe總線的物理層定義了LTSSM(Link Training and Status State Machine)狀態(tài)機(jī)，PCIe鏈路使用該狀態(tài)機(jī)管理鏈路狀態(tài)，并進(jìn)行鏈路訓(xùn)練、鏈路恢復(fù)和電源管理。

PCIe總線的物理層還定義了一些專門的“序列”，有的書籍將物理層這些“序列”稱為PLP(Phsical Layer Packer)，這些序列用于同步PCIe鏈路，并進(jìn)行鏈路管理。值得注意的是PCIe設(shè)備發(fā)送PLP與發(fā)送TLP的過程有所不同。對(duì)于系統(tǒng)軟件而言，物理層幾乎不可見，但是系統(tǒng)程序員仍有必要較為深入地理解物理層的工作原理。

1.4 數(shù)據(jù)鏈路的擴(kuò)展

PCIe鏈路使用端到端的數(shù)據(jù)傳送方式。在一條PCIe鏈路中，這兩個(gè)端口是完全對(duì)等的，分別連接發(fā)送與接收設(shè)備，而且一個(gè)PCIe鏈路的一端只能連接一個(gè)發(fā)送設(shè)備或者接收設(shè)備。因此PCIe鏈路必須使用Switch擴(kuò)展PCIe鏈路后，才能連接多個(gè)設(shè)備。使用Switch進(jìn)行鏈路擴(kuò)展的實(shí)例如圖45所示。

在PCIe總線中，Switch[2]是一個(gè)特殊的設(shè)備，該設(shè)備由1個(gè)上游端口和2~n個(gè)下游端口組成。PCIe總線規(guī)定，在一個(gè)Switch中可以與RC直接或者間接相連[3]的端口為上游端口，在PCIe總線中，RC的位置一般在上方，這也是上游端口這個(gè)稱呼的由來。在Switch中除了上游端口外，其他所有端口都被稱為下游端口。下游端口一般與EP相連，或者連接下一級(jí)Switch繼續(xù)擴(kuò)展PCIe鏈路。其中與上游端口相連的PCIe鏈路被稱為上游鏈路，與下游端口相連的PCIe鏈路被稱為下游鏈路。

上游鏈路和下游鏈路是一個(gè)相對(duì)的概念。如上圖所示，Switch與EP2連接的PCIe鏈路，對(duì)于EP2而言是上游鏈路，而對(duì)Switch而言是下游鏈路。

在上圖所示的Switch中含有3個(gè)端口，其中一個(gè)是上游端口(Upstream Port)，而其他兩個(gè)為下游端口(Downstream Port)。其中上游端口與RC或者其他Switch的下游端口相連，而下游端口與EP或者其他Switch的上游端口相連。

在Switch中，還有兩個(gè)與端口相關(guān)的概念，分別是Egress端口和Ingress端口。這兩個(gè)端口與通過Switch的數(shù)據(jù)流向有關(guān)。其中Egress端口指發(fā)送端口，即數(shù)據(jù)離開Switch使用的端口；Ingress端口指接收端口即數(shù)據(jù)進(jìn)入Switch使用的端口。

Egress端口和Ingress端口與上下游端口沒有對(duì)應(yīng)關(guān)系。在Switch中，上下游端口可以作為Egress端口，也可以作為Ingress端口。如圖45所示，RC對(duì)EP3的內(nèi)部寄存器進(jìn)行寫操作時(shí)，Switch的上游端口為Ingress端口，而下游端口為Egress端口；當(dāng)EP3對(duì)主存儲(chǔ)器進(jìn)行DMA寫操作時(shí)，該Switch的上游端口為Egress端口，而下游端口為Ingress端口。

PCIe總線還規(guī)定了一種特殊的Switch連接方式，即Crosslink連接模式。支持這種模式的Switch，其上游端口可以與其他Switch的上游端口連接，其下游端口可以與其他Switch的下游端口連接。

PCIe總線提供CrossLink連接模式的主要目的是為了解決不同處理器系統(tǒng)之間的互連，如圖46所示。使用CrossLink連接模式時(shí)，雖然從物理結(jié)構(gòu)上看，一個(gè)Switch的上/下游端口與另一個(gè)Switch的上/下游端口直接相連，但是這個(gè)PCIe鏈路經(jīng)過訓(xùn)練后，仍然是一個(gè)端口作為上游端口，而另一個(gè)作為下游端口。

處理器系統(tǒng)1與處理器系統(tǒng)2間的數(shù)據(jù)交換可以通過Crosslink進(jìn)行。當(dāng)處理器系統(tǒng)1(2)訪問的PCI總線域的地址空間或者Requester ID不在處理器系統(tǒng)1(2)內(nèi)時(shí)，這些數(shù)據(jù)將被Crosslink端口接收，并傳遞到對(duì)端處理器系統(tǒng)中。Crosslink對(duì)端接口的P2P橋?qū)⒔邮諄碜粤硪粋€(gè)處理器域的數(shù)據(jù)請求，并將其轉(zhuǎn)換為本處理器域的數(shù)據(jù)請求。

使用Crosslink方式連接兩個(gè)拓?fù)浣Y(jié)構(gòu)完全相同的處理器系統(tǒng)時(shí)，仍然有不足之處。假設(shè)圖46中的處理器系統(tǒng)1和2的RC使用的ID號(hào)都為0，而主存儲(chǔ)器都是從0x0000-0000開始編址時(shí)。當(dāng)處理器1讀取EP2的某段PCI總線空間時(shí)，EP2將使用ID路由方式，將完成報(bào)文傳送給ID號(hào)為0的PCI設(shè)備，此時(shí)是處理器2的RC而不是處理器1的RC收到EP2的數(shù)據(jù)。因?yàn)樘幚砥?和2的RC使用的ID號(hào)都為0，EP2不能區(qū)分這兩個(gè)RC。

由上所述，使用Crosslink方式并不能完全解決兩個(gè)處理器系統(tǒng)的互連問題，因此在有些Switch中支持非透明橋結(jié)構(gòu)。這種結(jié)構(gòu)與PCI總線非透明橋的實(shí)現(xiàn)機(jī)制類似，本章對(duì)此不做進(jìn)一步說明。

使用非透明橋僅解決了兩個(gè)處理器間數(shù)據(jù)通路問題，但是不便于NUMA結(jié)構(gòu)對(duì)外部設(shè)備的統(tǒng)一管理。PCIe總線對(duì)此問題的最終解決方法是使用MR-IOV技術(shù)，該技術(shù)要求Switch具有多個(gè)上游端口分別與不同的RC互連。目前PLX公司已經(jīng)可以提供具有多個(gè)上游端口的Switch，但是尚未實(shí)現(xiàn)MR-IOV技術(shù)涉及的一些與虛擬化相關(guān)的技術(shù)。

即便MR-IOV技術(shù)可以合理解決多個(gè)處理器間的數(shù)據(jù)訪問和對(duì)PCIe設(shè)備的配置管理，使用PCIe總線進(jìn)行兩個(gè)或者多個(gè)處理器系統(tǒng)間的數(shù)據(jù)傳遞仍然是一個(gè)不小問題。因?yàn)镻CIe總線的傳送延時(shí)仍然是制約其在大規(guī)模處理器系統(tǒng)互連中應(yīng)用的重要因素。

編輯：hfy

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報(bào)投訴

處理器

處理器

+關(guān)注

關(guān)注
68

文章
19657

瀏覽量
232457
PCIe

PCIe

+關(guān)注

關(guān)注
16

文章
1294

瀏覽量
84266
PCIE總線

PCIE總線

+關(guān)注

關(guān)注
0

文章
58

瀏覽量
13635
差分信號(hào)

差分信號(hào)

+關(guān)注

關(guān)注
3

文章
381

瀏覽量
27978
數(shù)據(jù)鏈路

數(shù)據(jù)鏈路

+關(guān)注

關(guān)注
0

文章
26

瀏覽量
9032

評(píng)論

相關(guān)推薦

特斯拉帶火“端到端”智駕，國內(nèi)車企加速上車

在內(nèi)的全鏈路自動(dòng)駕駛軟硬件架構(gòu)。而FSDV12采用的“端到端”的自動(dòng)駕駛系統(tǒng)，能夠高度模擬人類駕駛行為，實(shí)現(xiàn)感知決策一體化。近日，特斯拉正式

發(fā)表于 12-02 08:45 ?2092次閱讀

特斯拉帶火“<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>”智駕，國內(nèi)車企加速上車

【高清視頻案例分享】CameraLink接口的PCIe采集卡，基于FPGA開發(fā)平臺(tái)

現(xiàn)代計(jì)算機(jī)系統(tǒng)對(duì)高速數(shù)據(jù)傳輸?shù)男枨蟆?工作原理 PCIe采用了點(diǎn)對(duì)點(diǎn)的串行連接方式，每個(gè)設(shè)備都通過專用的鏈路與主機(jī)或其他設(shè)備進(jìn)行連接。數(shù)據(jù)在

發(fā)表于 03-25 15:21

端到端自動(dòng)駕駛技術(shù)研究與分析

傳遞和全局優(yōu)化的優(yōu)勢，成為智能駕駛技術(shù)發(fā)展的重要方向。與傳統(tǒng)模塊化架構(gòu)相比，端到端技術(shù)通過深度神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)從傳感器數(shù)據(jù)輸入

發(fā)表于 12-19 13:07 ?608次閱讀

調(diào)試PCIE鏈路動(dòng)態(tài)均衡介紹

，它會(huì)衰減數(shù)據(jù)流中的關(guān)鍵高頻分量，此外，由連接器和過孔引起的鏈路阻抗不連續(xù)會(huì)進(jìn)一步降低鏈路性能。 PCI

發(fā)表于 12-05 09:18 ?1266次閱讀

端到端已來，智駕仿真測試該怎么做？

端到端智駕方案因強(qiáng)泛化能力、可持續(xù)學(xué)習(xí)與升級(jí)等優(yōu)勢備受矚目，但這對(duì)仿真測試帶來了巨大挑戰(zhàn)。康謀探索了一種有效的端到

發(fā)表于 12-04 09:59 ?3024次閱讀

PCIe數(shù)據(jù)傳輸協(xié)議詳解

、網(wǎng)卡和聲卡等，以實(shí)現(xiàn)高效的數(shù)據(jù)傳輸。以下是對(duì)PCIe數(shù)據(jù)傳輸協(xié)議的介紹：一、PCIe協(xié)議的基本概念 PCIe協(xié)議定義了一系列規(guī)范和要求，

發(fā)表于 11-26 16:12 ?2707次閱讀

爆火的端到端如何加速智駕落地？

自動(dòng)駕駛，唯有端到端？）端到端技術(shù)通過消除模塊間數(shù)據(jù)傳遞

發(fā)表于 11-26 13:17 ?646次閱讀

連接視覺語言大模型與端到端自動(dòng)駕駛

端到端自動(dòng)駕駛在大規(guī)模駕駛數(shù)據(jù)上訓(xùn)練，展現(xiàn)出很強(qiáng)的決策規(guī)劃能力，但是面對(duì)復(fù)雜罕見的駕駛場景，依然存在局限性，這是因?yàn)?b class='flag-5'>端

發(fā)表于 11-07 15:15 ?525次閱讀

智己汽車“端到端”智駕方案推出，老司機(jī)真的會(huì)被取代嗎？

與Momenta聯(lián)合打造的IM AD 3.0端到端直覺智能駕駛系統(tǒng)，在結(jié)構(gòu)設(shè)計(jì)和決策邏輯上，進(jìn)行了大膽的創(chuàng)新，試圖用“直覺化”思維模式替代傳統(tǒng)的模塊化系統(tǒng)。 ? IM AD 3.0的技術(shù)架構(gòu)：

發(fā)表于 10-30 09:47 ?582次閱讀

端到端InfiniBand網(wǎng)絡(luò)解決LLM訓(xùn)練瓶頸

的，這需要大量的計(jì)算資源和高速數(shù)據(jù)傳輸網(wǎng)絡(luò)。端到端InfiniBand（IB）網(wǎng)絡(luò)作為高性能計(jì)算和AI模型訓(xùn)練的理想選擇，發(fā)揮著重要作用。在本文中，我們將深入探討大型語言模型（LLM）

發(fā)表于 10-23 11:26 ?885次閱讀

端到端測試用例怎么寫

編寫端到端測試用例是確保軟件系統(tǒng)從頭到尾能夠正常工作的關(guān)鍵步驟。以下是一個(gè)詳細(xì)的指南，介紹如何編寫端到端

發(fā)表于 09-20 10:29 ?773次閱讀

PCle鏈路培訓(xùn)概述

電子發(fā)燒友網(wǎng)站提供《PCle鏈路培訓(xùn)概述.pdf》資料免費(fèi)下載

發(fā)表于 09-11 09:16 ?0次下載

IR615如何實(shí)現(xiàn)VPN鏈路備份？

網(wǎng)絡(luò)連通性，可以看到模擬故障后丟失三個(gè)數(shù)據(jù)包。模擬故障恢復(fù)，連接wan口網(wǎng)線，查看路由表?？梢钥吹铰酚梢呀?jīng)恢復(fù)到wan口。 OpenServer端查看看，可以看到鏈

發(fā)表于 07-25 08:27

XIO2221單功能PCI ExpressTM (PCle)到PCI本地總線轉(zhuǎn)換橋數(shù)據(jù)表

電子發(fā)燒友網(wǎng)站提供《XIO2221單功能PCI ExpressTM (PCle)到PCI本地總線轉(zhuǎn)換橋數(shù)據(jù)表.pdf》資料免費(fèi)下載

發(fā)表于 07-10 11:21 ?0次下載

小鵬汽車發(fā)布端到端大模型

小鵬汽車近日宣布，其成功研發(fā)并發(fā)布了“國內(nèi)首個(gè)量產(chǎn)上車”的端到端大模型，該模型可直接通過傳感器輸入內(nèi)容來控制車輛，標(biāo)志著智能駕駛技術(shù)的新突破。

發(fā)表于 05-21 15:09 ?836次閱讀