資料介紹
在系統(tǒng)性能與編程簡易性之間的權(quán)衡折中是通用操作系統(tǒng)與實時操作系統(tǒng)之間的主要區(qū)分點之一。
GPOS 傾向于提供較高程度的資源抽象,這不僅可通過支持軟件模塊性與資源隔離來提高應(yīng)用的便攜性、簡化開發(fā)流程,同時還能增強系統(tǒng)的穩(wěn)健性。這使 GPOS 成為諸如網(wǎng)絡(luò)、用戶界面以及顯示管理等通用系統(tǒng)組件的理想選擇。
然而,該抽象需要以系統(tǒng)資源的精細粒度控制作為代價,以滿足信號處理代碼等高強度算法的計算性能要求。對于實現(xiàn)這種高級別的控制,開發(fā)人員通常需要采用實時操作系統(tǒng) (RTOS)。
從嵌入式信號處理角度上講,我們通常要考慮兩種類型的操作系統(tǒng),即通用操作系統(tǒng) Linux 與實時操作系統(tǒng) DSP/BIOS。Linux 可支持更高水平的抽象技術(shù),而 DSP/BIOS 則可提供更精細的控制。
為了充分發(fā)揮這兩種操作系統(tǒng)的優(yōu)勢,開發(fā)人員可采用系統(tǒng)虛擬機,這就使編程人員可在同一 DSP 處理器上同時運行 Linux 與 DSP/BIOS 系統(tǒng)。
?。ň幷咦ⅲ号c Java 虛擬機等特定編程語言使用的進程虛擬機環(huán)境不同,系統(tǒng)虛擬機對應(yīng)于實際硬件,可在相同計算環(huán)境中與其它類似實例相隔離的情況下執(zhí)行完整的操作系統(tǒng)。)
然而,我們要提出一個重要的問題:為什么不使用分別運行 Linux 與 DSP/BIOS 系統(tǒng)的 CPU+DSP 組合器件呢?畢竟,CPU 在運行用戶接口控制代碼等方面具有更高的效率。此外,不同的內(nèi)核可避免虛擬化帶來的開銷。不過,在同一顆芯片上集成所有功能還是很有吸引力的,原因如下:
其一,當(dāng)今高性能 DSP 比前代 DSP 要強大得多,這樣可減少控制處理周期數(shù)。其二,大多數(shù)高性能 DSP 的通用性能均比前代產(chǎn)品更強,從而可實現(xiàn)更高效的控制代碼處理工作。
如果所有功能都可集成在 DSP 上,那么其優(yōu)勢將更加出眾。更少的芯片數(shù)量可實現(xiàn)更低的成本與更小的占用空間。此外,由于不再需要在耗費大量電力的處理器間數(shù)據(jù)傳輸,因此還可降低能耗。
進度安排
操作系統(tǒng)最常見也是最有利的一個特性就是能同時執(zhí)行多個任務(wù)或多個線程。操作系統(tǒng)通過時間表來管理內(nèi)核處理,以連續(xù)執(zhí)行相關(guān)任務(wù)。
以往,嵌入式編程人員在使用 Linux 時會擔(dān)心實時性能較低的問題。不過,對 Linux 內(nèi)核的最新增強顯著提高了其對系統(tǒng)事件的響應(yīng)能力,從而使其可滿足各種企業(yè)與個人以及嵌入式產(chǎn)品的需求。
Linux 可實現(xiàn)線程的時間切片以及優(yōu)先次序時間安排。時間切片技術(shù)是指在所有線程之間共享處理工作周期,以確保無封鎖線程。這種方法通常適用于用戶接口功能,以確保在系統(tǒng)超載、響應(yīng)較慢的情況下也不至于完全丟失用戶功能。
與此形成對比的是,優(yōu)先次序線程時間安排技術(shù)則可確保系統(tǒng)中最高優(yōu)先級線程的執(zhí)行,直至該線程放棄控制為止,這時下一個最高優(yōu)先級的線程即開始執(zhí)行。
Linux 內(nèi)核在每次從內(nèi)核到用戶模式的轉(zhuǎn)換時都會對可用線程的優(yōu)先級進行重新評估,這就意味著內(nèi)核最新評估的任何事件(如驅(qū)動程序上數(shù)據(jù)的可用性)都能立即觸發(fā)新線程(調(diào)度器的時延響應(yīng)時間內(nèi))的轉(zhuǎn)換。由于確定了基于優(yōu)先級的線程,其通常用于必須滿足實時要求的信號處理應(yīng)用。
在推出 Linux 內(nèi)核 2.6 版本之前,制約實時性能的主要因素是 Linux 內(nèi)核會禁用中斷,且禁用時間有時會長達數(shù)百毫秒。
就此而言,我們可以提高內(nèi)核實施的效率。因為在禁用中斷時,代碼的某些部分無需重新進入,而這會增加中斷響應(yīng)的時延。
目前的 2.6 版本提供了構(gòu)建選項,可在整個內(nèi)核代碼中以更高的頻率插入中斷再啟用指令。Linux 社區(qū)通常將該特性稱作先占內(nèi)核 (preempt kernel),盡管這會讓內(nèi)核性能略有下降,但卻能夠顯著提高實時性能。對于眾多系統(tǒng)任務(wù)而言,在先占性 Linux 2.6 內(nèi)核與實時線程結(jié)合使用時,將能提供足夠的性能來滿足實時需求。
例如,德州儀器 (TI) 的 DSP/BIOS 以軟件中斷和任務(wù)的形式僅支持優(yōu)先級調(diào)度。與 Linux 調(diào)度器一樣,軟件中斷和任務(wù)都屬于先占型的。但是,DSP/BIOS 也為應(yīng)用編程人員提供了直接存取硬件中斷的條件,該資源僅適用于 Linux 內(nèi)核模式。
直接存取硬件中斷使應(yīng)用編程人員可在理論上實現(xiàn)底層硬件所支持的最短時延響應(yīng)。對控制環(huán)路等需要絕對最低時延的應(yīng)用而言,這種精細粒度的硬件中斷控制機制通常是一種非常重要的特性。
受保護的資源訪問
Linux 與大多數(shù)通用操作系統(tǒng)的一個基本屬性就是用戶空間程序與所用的底層系統(tǒng)資源相分離。僅在工作處于監(jiān)控(如內(nèi)核)模式下時才允許直接訪問存儲器和設(shè)備外設(shè)。
如果用戶程序希望訪問系統(tǒng)資源,那么它必須通過稱作驅(qū)動器的內(nèi)核模塊從內(nèi)核發(fā)出請求。該應(yīng)用位于用戶存儲器空間,并將通過虛擬文件訪問驅(qū)動程序。然后,虛擬文件將應(yīng)用的請求轉(zhuǎn)至驅(qū)動器執(zhí)行的內(nèi)核存儲器空間。
Linux 可提供特性極為豐富的驅(qū)動器模型,其中包括標準流媒體外設(shè)、模塊存儲設(shè)備以及文件系統(tǒng),甚至還包括網(wǎng)絡(luò)與基于網(wǎng)絡(luò)的文件系統(tǒng)。
驅(qū)動器與用戶空間應(yīng)用的分離可實現(xiàn)高度的穩(wěn)健性。此外,通用驅(qū)動器接口上的抽象水平使其便于將數(shù)據(jù)流傳輸給串行端口、閃存文件系統(tǒng)或網(wǎng)絡(luò)共享文件夾,且僅需對底層應(yīng)用代碼稍作更改。
然而,實現(xiàn)這種靈活性需要付出代價。應(yīng)用與物理資源的嚴格分離會加大開銷。如果用戶空間程序要訪問設(shè)備外設(shè),則內(nèi)核模式必須進行環(huán)境交換才能處理該請求。
由于數(shù)據(jù)是成塊訪問,而非逐個樣本 (sample-by-sample) 訪問,因此通常來說這不會造成太大的局限性。這樣,內(nèi)核模式下每次塊訪問僅需進行一次環(huán)境交換即可。
但是,在某些情況下,應(yīng)用代碼需與物理硬件嚴格匹配。如果使用 DSP 等對數(shù)據(jù)吞吐量要求較高且不能容忍停頓的高性能處理器時,通常就會出現(xiàn)此類情況。這時,內(nèi)核空間的物理資源與用戶空間的應(yīng)用相分離的做法就可能會嚴重影響系統(tǒng)性能。
應(yīng)用與硬件的匹配
我們不妨使用 TMS320DM643x 處理器架構(gòu)來研究在執(zhí)行塊視頻處理時會遇到的典型情況,該架構(gòu)采用一個 600 MHz / 4800 MIPS DSP 處理內(nèi)核以及諸如功能豐富的視頻端口子系統(tǒng)等各種多媒體外設(shè)。這種硬件通常用于將輸入視頻流進行 H.264 格式壓縮。
為了充分發(fā)揮 DSP 內(nèi)核的處理能力,處理的數(shù)據(jù)應(yīng)從周期操作內(nèi)部存儲器讀取,而不是從速度較慢的外部存儲器讀取。盡管在技術(shù)上可以讓具有足夠快的片上存儲器的處理器存儲一個或多個完整的視頻幀,但這種技術(shù)對大多數(shù)目標市場來說成本太高。因此,采用可提供 80 KB 的單周期操作片上數(shù)據(jù)存儲器的處理器取而代之。
80 KB 雖然小,不能存儲完整的視頻幀,但 TI 通過模擬檢測認為,這樣的存儲量足夠為 H.264與其它視頻處理算法提供最佳的面積/性能綜合比。
DSP 通過直接存儲器存取 (DMA) 控制器為該存儲器提供數(shù)據(jù),這種控制器還可用于內(nèi)外部存儲器之間高效傳輸數(shù)據(jù)子塊,而不會占用處理器內(nèi)核的周期操作(見以下圖 1)。
圖 1. DSP 處理器采用DMA 硬件將外部存儲器中較小的視頻幀子塊傳輸?shù)絻?nèi)部存儲器中,以供 DSP內(nèi)核進行處理。
GPOS 傾向于提供較高程度的資源抽象,這不僅可通過支持軟件模塊性與資源隔離來提高應(yīng)用的便攜性、簡化開發(fā)流程,同時還能增強系統(tǒng)的穩(wěn)健性。這使 GPOS 成為諸如網(wǎng)絡(luò)、用戶界面以及顯示管理等通用系統(tǒng)組件的理想選擇。
然而,該抽象需要以系統(tǒng)資源的精細粒度控制作為代價,以滿足信號處理代碼等高強度算法的計算性能要求。對于實現(xiàn)這種高級別的控制,開發(fā)人員通常需要采用實時操作系統(tǒng) (RTOS)。
從嵌入式信號處理角度上講,我們通常要考慮兩種類型的操作系統(tǒng),即通用操作系統(tǒng) Linux 與實時操作系統(tǒng) DSP/BIOS。Linux 可支持更高水平的抽象技術(shù),而 DSP/BIOS 則可提供更精細的控制。
為了充分發(fā)揮這兩種操作系統(tǒng)的優(yōu)勢,開發(fā)人員可采用系統(tǒng)虛擬機,這就使編程人員可在同一 DSP 處理器上同時運行 Linux 與 DSP/BIOS 系統(tǒng)。
?。ň幷咦ⅲ号c Java 虛擬機等特定編程語言使用的進程虛擬機環(huán)境不同,系統(tǒng)虛擬機對應(yīng)于實際硬件,可在相同計算環(huán)境中與其它類似實例相隔離的情況下執(zhí)行完整的操作系統(tǒng)。)
然而,我們要提出一個重要的問題:為什么不使用分別運行 Linux 與 DSP/BIOS 系統(tǒng)的 CPU+DSP 組合器件呢?畢竟,CPU 在運行用戶接口控制代碼等方面具有更高的效率。此外,不同的內(nèi)核可避免虛擬化帶來的開銷。不過,在同一顆芯片上集成所有功能還是很有吸引力的,原因如下:
其一,當(dāng)今高性能 DSP 比前代 DSP 要強大得多,這樣可減少控制處理周期數(shù)。其二,大多數(shù)高性能 DSP 的通用性能均比前代產(chǎn)品更強,從而可實現(xiàn)更高效的控制代碼處理工作。
如果所有功能都可集成在 DSP 上,那么其優(yōu)勢將更加出眾。更少的芯片數(shù)量可實現(xiàn)更低的成本與更小的占用空間。此外,由于不再需要在耗費大量電力的處理器間數(shù)據(jù)傳輸,因此還可降低能耗。
進度安排
操作系統(tǒng)最常見也是最有利的一個特性就是能同時執(zhí)行多個任務(wù)或多個線程。操作系統(tǒng)通過時間表來管理內(nèi)核處理,以連續(xù)執(zhí)行相關(guān)任務(wù)。
以往,嵌入式編程人員在使用 Linux 時會擔(dān)心實時性能較低的問題。不過,對 Linux 內(nèi)核的最新增強顯著提高了其對系統(tǒng)事件的響應(yīng)能力,從而使其可滿足各種企業(yè)與個人以及嵌入式產(chǎn)品的需求。
Linux 可實現(xiàn)線程的時間切片以及優(yōu)先次序時間安排。時間切片技術(shù)是指在所有線程之間共享處理工作周期,以確保無封鎖線程。這種方法通常適用于用戶接口功能,以確保在系統(tǒng)超載、響應(yīng)較慢的情況下也不至于完全丟失用戶功能。
與此形成對比的是,優(yōu)先次序線程時間安排技術(shù)則可確保系統(tǒng)中最高優(yōu)先級線程的執(zhí)行,直至該線程放棄控制為止,這時下一個最高優(yōu)先級的線程即開始執(zhí)行。
Linux 內(nèi)核在每次從內(nèi)核到用戶模式的轉(zhuǎn)換時都會對可用線程的優(yōu)先級進行重新評估,這就意味著內(nèi)核最新評估的任何事件(如驅(qū)動程序上數(shù)據(jù)的可用性)都能立即觸發(fā)新線程(調(diào)度器的時延響應(yīng)時間內(nèi))的轉(zhuǎn)換。由于確定了基于優(yōu)先級的線程,其通常用于必須滿足實時要求的信號處理應(yīng)用。
在推出 Linux 內(nèi)核 2.6 版本之前,制約實時性能的主要因素是 Linux 內(nèi)核會禁用中斷,且禁用時間有時會長達數(shù)百毫秒。
就此而言,我們可以提高內(nèi)核實施的效率。因為在禁用中斷時,代碼的某些部分無需重新進入,而這會增加中斷響應(yīng)的時延。
目前的 2.6 版本提供了構(gòu)建選項,可在整個內(nèi)核代碼中以更高的頻率插入中斷再啟用指令。Linux 社區(qū)通常將該特性稱作先占內(nèi)核 (preempt kernel),盡管這會讓內(nèi)核性能略有下降,但卻能夠顯著提高實時性能。對于眾多系統(tǒng)任務(wù)而言,在先占性 Linux 2.6 內(nèi)核與實時線程結(jié)合使用時,將能提供足夠的性能來滿足實時需求。
例如,德州儀器 (TI) 的 DSP/BIOS 以軟件中斷和任務(wù)的形式僅支持優(yōu)先級調(diào)度。與 Linux 調(diào)度器一樣,軟件中斷和任務(wù)都屬于先占型的。但是,DSP/BIOS 也為應(yīng)用編程人員提供了直接存取硬件中斷的條件,該資源僅適用于 Linux 內(nèi)核模式。
直接存取硬件中斷使應(yīng)用編程人員可在理論上實現(xiàn)底層硬件所支持的最短時延響應(yīng)。對控制環(huán)路等需要絕對最低時延的應(yīng)用而言,這種精細粒度的硬件中斷控制機制通常是一種非常重要的特性。
受保護的資源訪問
Linux 與大多數(shù)通用操作系統(tǒng)的一個基本屬性就是用戶空間程序與所用的底層系統(tǒng)資源相分離。僅在工作處于監(jiān)控(如內(nèi)核)模式下時才允許直接訪問存儲器和設(shè)備外設(shè)。
如果用戶程序希望訪問系統(tǒng)資源,那么它必須通過稱作驅(qū)動器的內(nèi)核模塊從內(nèi)核發(fā)出請求。該應(yīng)用位于用戶存儲器空間,并將通過虛擬文件訪問驅(qū)動程序。然后,虛擬文件將應(yīng)用的請求轉(zhuǎn)至驅(qū)動器執(zhí)行的內(nèi)核存儲器空間。
Linux 可提供特性極為豐富的驅(qū)動器模型,其中包括標準流媒體外設(shè)、模塊存儲設(shè)備以及文件系統(tǒng),甚至還包括網(wǎng)絡(luò)與基于網(wǎng)絡(luò)的文件系統(tǒng)。
驅(qū)動器與用戶空間應(yīng)用的分離可實現(xiàn)高度的穩(wěn)健性。此外,通用驅(qū)動器接口上的抽象水平使其便于將數(shù)據(jù)流傳輸給串行端口、閃存文件系統(tǒng)或網(wǎng)絡(luò)共享文件夾,且僅需對底層應(yīng)用代碼稍作更改。
然而,實現(xiàn)這種靈活性需要付出代價。應(yīng)用與物理資源的嚴格分離會加大開銷。如果用戶空間程序要訪問設(shè)備外設(shè),則內(nèi)核模式必須進行環(huán)境交換才能處理該請求。
由于數(shù)據(jù)是成塊訪問,而非逐個樣本 (sample-by-sample) 訪問,因此通常來說這不會造成太大的局限性。這樣,內(nèi)核模式下每次塊訪問僅需進行一次環(huán)境交換即可。
但是,在某些情況下,應(yīng)用代碼需與物理硬件嚴格匹配。如果使用 DSP 等對數(shù)據(jù)吞吐量要求較高且不能容忍停頓的高性能處理器時,通常就會出現(xiàn)此類情況。這時,內(nèi)核空間的物理資源與用戶空間的應(yīng)用相分離的做法就可能會嚴重影響系統(tǒng)性能。
應(yīng)用與硬件的匹配
我們不妨使用 TMS320DM643x 處理器架構(gòu)來研究在執(zhí)行塊視頻處理時會遇到的典型情況,該架構(gòu)采用一個 600 MHz / 4800 MIPS DSP 處理內(nèi)核以及諸如功能豐富的視頻端口子系統(tǒng)等各種多媒體外設(shè)。這種硬件通常用于將輸入視頻流進行 H.264 格式壓縮。
為了充分發(fā)揮 DSP 內(nèi)核的處理能力,處理的數(shù)據(jù)應(yīng)從周期操作內(nèi)部存儲器讀取,而不是從速度較慢的外部存儲器讀取。盡管在技術(shù)上可以讓具有足夠快的片上存儲器的處理器存儲一個或多個完整的視頻幀,但這種技術(shù)對大多數(shù)目標市場來說成本太高。因此,采用可提供 80 KB 的單周期操作片上數(shù)據(jù)存儲器的處理器取而代之。
80 KB 雖然小,不能存儲完整的視頻幀,但 TI 通過模擬檢測認為,這樣的存儲量足夠為 H.264與其它視頻處理算法提供最佳的面積/性能綜合比。
DSP 通過直接存儲器存取 (DMA) 控制器為該存儲器提供數(shù)據(jù),這種控制器還可用于內(nèi)外部存儲器之間高效傳輸數(shù)據(jù)子塊,而不會占用處理器內(nèi)核的周期操作(見以下圖 1)。
圖 1. DSP 處理器采用DMA 硬件將外部存儲器中較小的視頻幀子塊傳輸?shù)絻?nèi)部存儲器中,以供 DSP內(nèi)核進行處理。
下載該資料的人也在下載
下載該資料的人還在閱讀
更多 >
- CCS中DSP/BIOS工具的使用 26次下載
- DSP/BIOS定義及開發(fā)說明 5次下載
- DSP/BIOS應(yīng)用程序升級2個方面的提升概述 3次下載
- 基于Linux的雙OS信號處理技術(shù)解析 0次下載
- 多信號并行處理軟件架構(gòu)設(shè)計分析 0次下載
- DSP_BIOS講座 3次下載
- 如何開始學(xué)習(xí)DSP_BIOS 11次下載
- 基于雙DSP的信號處理板的設(shè)計及其在SAR信號仿真中的應(yīng)用
- 如何創(chuàng)建一個DSP/BIOS程序
- 基于DSP和DSP/BIOS的實時雷達信號采集與處理系統(tǒng)
- 基于DSP BIOS的實時語音混沌加密系統(tǒng)
- DSP BIOS實時內(nèi)核在視頻目標跟蹤系統(tǒng)中的應(yīng)用
- DSP/BIOS多任務(wù)環(huán)境下的實時數(shù)據(jù)采集與處理
- 基于DSP/BIOS的交流信號檢測研究
- DSP集成開發(fā)環(huán)境--CCS及DSP/BIOS的原理與應(yīng)用
- 雙核dsp和單核dsp的區(qū)別 951次閱讀
- dsp是什么意思 dsp功放對音質(zhì)到底有沒有提升 1.9w次閱讀
- DSP芯片的特點與分類 2902次閱讀
- DSP/BIOS通信方式DSP應(yīng)用系統(tǒng)輸入輸出中的應(yīng)用分析 3004次閱讀
- 基于FPGA和雙GA3816處理器實現(xiàn)數(shù)字通用信號處理系統(tǒng)的設(shè)計 2121次閱讀
- 淺談差分處理和信號分析 2160次閱讀
- SYS/BIOS修改存儲器映射的詳細步驟 3893次閱讀
- Chrome OS設(shè)備即將允許用戶自行選擇Linux的發(fā)行版了嗎 2378次閱讀
- 一文了解dsp數(shù)字信號處理器 6031次閱讀
- 嵌入式Linux OS啟動流程 3751次閱讀
- DSP是什么?詳解DSP又稱數(shù)字信號處理器 4.8w次閱讀
- 基于DSP/BIOS的多信號并行處理軟件架構(gòu)設(shè)計 1825次閱讀
- 基于DSP的語音信號處理系統(tǒng)中的抗干擾技術(shù) 1829次閱讀
- 雙DSP柔性處理系統(tǒng)研究 1419次閱讀
- 基于DSP的聲雷達信號采集系統(tǒng) 1580次閱讀
下載排行
本周
- 1TC358743XBG評估板參考手冊
- 1.36 MB | 330次下載 | 免費
- 2開關(guān)電源基礎(chǔ)知識
- 5.73 MB | 6次下載 | 免費
- 3100W短波放大電路圖
- 0.05 MB | 4次下載 | 3 積分
- 4嵌入式linux-聊天程序設(shè)計
- 0.60 MB | 3次下載 | 免費
- 5基于FPGA的光纖通信系統(tǒng)的設(shè)計與實現(xiàn)
- 0.61 MB | 2次下載 | 免費
- 6基于FPGA的C8051F單片機開發(fā)板設(shè)計
- 0.70 MB | 2次下載 | 免費
- 751單片機窗簾控制器仿真程序
- 1.93 MB | 2次下載 | 免費
- 8基于51單片機的RGB調(diào)色燈程序仿真
- 0.86 MB | 2次下載 | 免費
本月
- 1OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234315次下載 | 免費
- 2555集成電路應(yīng)用800例(新編版)
- 0.00 MB | 33564次下載 | 免費
- 3接口電路圖大全
- 未知 | 30323次下載 | 免費
- 4開關(guān)電源設(shè)計實例指南
- 未知 | 21548次下載 | 免費
- 5電氣工程師手冊免費下載(新編第二版pdf電子書)
- 0.00 MB | 15349次下載 | 免費
- 6數(shù)字電路基礎(chǔ)pdf(下載)
- 未知 | 13750次下載 | 免費
- 7電子制作實例集錦 下載
- 未知 | 8113次下載 | 免費
- 8《LED驅(qū)動電路設(shè)計》 溫德爾著
- 0.00 MB | 6653次下載 | 免費
總榜
- 1matlab軟件下載入口
- 未知 | 935054次下載 | 免費
- 2protel99se軟件下載(可英文版轉(zhuǎn)中文版)
- 78.1 MB | 537796次下載 | 免費
- 3MATLAB 7.1 下載 (含軟件介紹)
- 未知 | 420026次下載 | 免費
- 4OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234315次下載 | 免費
- 5Altium DXP2002下載入口
- 未知 | 233046次下載 | 免費
- 6電路仿真軟件multisim 10.0免費下載
- 340992 | 191185次下載 | 免費
- 7十天學(xué)會AVR單片機與C語言視頻教程 下載
- 158M | 183278次下載 | 免費
- 8proe5.0野火版下載(中文版免費下載)
- 未知 | 138040次下載 | 免費
評論
查看更多