作者: xhackerustc@21ic
國慶前有一塊RA生態(tài)工作室出品的RA8D1B-CPKCOR開發(fā)板到了,主控瑞薩RA8D1B MCU,基于Arm Cortex-M85,支持Helium 和 TrustZone,CPU頻率高達(dá)480MHZ。似乎是世界第一款使用Cortex-M85的MCU?RA8D1集成2MB flash和1MB的SRAM,I/D-cache 32KB。集成一堆豐富外設(shè)主控,比如usb、eth、i2c、i3c、spi、sdhci、ospi、canfd、MIPI-DSI、CEU攝像頭、2D圖形、TFT顯示控制等等,MCU功能已經(jīng)非常強(qiáng)大。更有意思的是RA8D1B-CPKCOR板載了32MB SDRAM,16MB的QSPI flash,看到這些尤其是32MB的SDRAM筆者覺得這板子足夠跑linux系統(tǒng)了,雖然Cortex-M85無MMU,但主線linux早已經(jīng)支持NOMMU了。要說生態(tài)沒有哪個(gè)RTOS能和linux比生態(tài),在不要求硬實(shí)時(shí)的應(yīng)用場景中利用linux系統(tǒng)的豐富生態(tài)能大大降低軟件工作量。一個(gè)復(fù)雜MCU平臺(tái)的軟件工作量非常大,特別是集成M7、M85這樣高性能的core(M7 coremark/MHZ超過A7)的MCU,外設(shè)通常也是比較豐富的,大多數(shù)系統(tǒng)還板載了SDRAM或PSRAM,如果再以裸機(jī)思維去做軟件,軟件復(fù)雜度大到不可想象。
那咱們就開始RA8D1B移植linux的旅程了:
初始化sdram,其實(shí)RA生態(tài)工作室其實(shí)做好了,直接把他們的board_sdram.c和board_sdram.h拷貝過來即可。這一步最好做下內(nèi)存讀寫的壓力測試,我沒用他們的測試code,自己寫了一份,為啥呢:linux下讀寫內(nèi)存1字節(jié)、2字節(jié)、4字節(jié)都可能的,我想都測到,測試代碼如下:
#define SDRAM_BASE_ADDRESS (0x68000000U) static void sdram_test(void) { int i; uint32_t addr; uint32_t t1; uint8_t testbuf[64]; void *p = (void *)SDRAM_BASE_ADDRESS; APP_PRINT("Writing SDRAM...\n"); printf("Writing SDRAM...\n"); for (addr = 0; addr < 32 * 1024 * 1024; ++addr) { uint8_t data = addr & 0xff; *(uint8_t *)(p + addr) = data; } APP_PRINT("Reading SDRAM...\n"); printf("Reading SDRAM...\n"); for (addr = 0; addr < 32 * 1024 * 1024; ++addr) { uint8_t data, expected; expected = addr & 0xff; data = *(uint8_t *)(p + addr); if (data != expected) APP_PRINT("SDRAM 8bit read failed at %lx (%x != %x)\n", addr, data, expected); } APP_PRINT("SDRAM 8bit read pass.\n"); printf("SDRAM 8bit read pass.\n"); for (addr = 0; addr < 32 * 1024 * 1024; addr += 2) { uint16_t data, expected; expected = (((addr + 1) & 0xff) << 8) | (addr & 0xff); data = *(uint16_t *)(p + addr); if (data != expected) APP_PRINT("SDRAM 16bit read failed at %lx (%x != %x)\n", addr, data, expected); } APP_PRINT("SDRAM 16bit read pass.\n"); printf("SDRAM 16bit read pass.\n"); for (addr = 0; addr < 32 * 1024 * 1024; addr += 4) { uint32_t data, expected; expected = (((addr + 3) & 0xff) << 24) | (((addr + 2) & 0xff) << 16) | (((addr + 1) & 0xff) << 8) | (addr & 0xff); data = *(uint32_t *)(p + addr); if (data != expected) APP_PRINT("SDRAM 32bit read failed at %lx (%lx != %lx)\n", addr, data, expected); } APP_PRINT("SDRAM 32bit read pass.\n"); printf("SDRAM 32bit read pass.\n"); memset(testbuf, 0x5a, sizeof(testbuf)); DWT_init(); t1 = DWT_get_count(); for (i = 0; i < 10000; ++i) { memcpy(p, testbuf, 64); } t1 = DWT_get_count() - t1; t1 = DWT_count_to_us(t1); t1 /= 1000; APP_PRINT("SDRAM write speed: %ld B/s.\n", 64 * 10000 * 1000 / t1); printf("SDRAM write speed: %ld B/s.\n", 64 * 10000 * 1000 / t1); t1 = DWT_get_count(); for (i = 0; i < 10000; ++i) { memcpy(testbuf, p, 64); } t1 = DWT_get_count() - t1; t1 = DWT_count_to_us(t1); t1 /= 1000; APP_PRINT("SDRAM read speed: %ld B/s.\n", 64 * 10000 * 1000 / t1); printf("SDRAM read speed: %ld B/s.\n", 64 * 10000 * 1000 / t1); for (;;) { APP_PRINT("SDRAM test done\n"); printf("SDRAM test done\n"); __WFI(); } }
這一步其實(shí)還有用FSP配置并生成項(xiàng)目工程,本人因習(xí)慣于Linux下開發(fā),所以生成的是CMake工程。這一步網(wǎng)上測評(píng)很多鋪天蓋地,且FSP使用并非本次主目標(biāo),這里不再贅述。
加載內(nèi)核image、dtb等可以從sd卡加載也可以從flash上加載,但bootloader不是本次主目標(biāo),能否偷懶呢?不要忘記板載的jlink,完全可以用jlink把內(nèi)核image和dtb加載到SDRAM指定位置,jlink加載命令語法如下:
loadfile FILE address noreset
比如
loadfile /tmp/Image.bin 0x68008000 noreset
noreset意思是只加載后不要reset目標(biāo)板,jlink loadfile默認(rèn)是reset的。
加載解決了,跳轉(zhuǎn)內(nèi)核入口呢?easy,使用jlink的wreg命令即可,語法如下:
wreg rN value
建議segger這里做下簡單更新,方便用戶,畢竟打雙引號(hào)再空格再括號(hào)相當(dāng)繁瑣。
32位arm對(duì)每款cpu都有一個(gè)所謂proc_info的結(jié)構(gòu)體,成員包含cpu setup函數(shù),cache操作函數(shù),hwcaps變量等等,cortex-m85呢筆者做這個(gè)事情的時(shí)候主線linux中還沒有這個(gè)結(jié)構(gòu)體。經(jīng)閱讀cortex-m85 TRM可以知道就上述操作函數(shù)等來講它和cortex-m55是兼容的,所以筆者打了個(gè)補(bǔ)丁如下:
--- a/arch/arm/mm/proc-v7m.S +++ b/arch/arm/mm/proc-v7m.S @[url=home.php?mod=space&uid=72445]@[/url] -194,6 +194,16 @[url=home.php?mod=space&uid=72445]@[/url] ENDPROC(__v7m_setup) .long \cache_fns .endm + /* + * Match ARM Cortex-M85 processor. + */ + .type __v7m_cm85_proc_info, #object +__v7m_cm85_proc_info: + .long 0x410fd230 /* ARM Cortex-M85 0xD23 */ + .long 0xff0ffff0 /* Mask off revision, patch release */ + __v7m_proc __v7m_cm85_proc_info, __v7m_cm7_setup, hwcaps = HWCAP_EDSP, cache_fns = v7m_cache_fns, proc_fns = cm7_processor_functions + .size __v7m_cm85_proc_info, . - __v7m_cm85_proc_info + /* * Match ARM Cortex-M55 processor. */
+++ b/arch/arm/include/asm/v7m.h @[url=home.php?mod=space&uid=72445]@[/url] -51,6 +51,7 @@ */ #define EXC_RET_STACK_MASK 0x00000004 #define EXC_RET_THREADMODE_PROCESSSTACK (3 << 2) +#define EXC_RET_FTYPE (1 << 4) /* Cache related definitions */ diff --git a/arch/arm/mm/proc-v7m.S b/arch/arm/mm/proc-v7m.S index ed7781c84341..fdae077d2654 100644 --- a/arch/arm/mm/proc-v7m.S +++ b/arch/arm/mm/proc-v7m.S @[url=home.php?mod=space&uid=72445]@[/url] -138,6 +138,7 @[url=home.php?mod=space&uid=72445]@[/url] __v7m_setup_cont: 1: cpsid i /* Calculate exc_ret */ orr r10, lr, #EXC_RET_THREADMODE_PROCESSSTACK + orr r10, #EXC_RET_FTYPE ldmia sp, {r0-r3, r12} str r5, [r12, #11 * 4] @ restore the original SVC vector entry mov lr, r6 @ restore LR
linux系統(tǒng)必有至少一個(gè)clockevent提供心跳中斷,一個(gè)clocksource提供計(jì)時(shí)。其中clockevent必須的,clocksource可以由內(nèi)核的jiffies代替,詳細(xì)筆者就不贅述了,因?yàn)榍扒昂蠛笾v清楚它們可以長篇大論寫兩三篇大文章,linux內(nèi)核這塊其實(shí)還蠻復(fù)雜的,但對(duì)clockevent和clocksource驅(qū)動(dòng)要提供的接口來說變簡單了,以后有機(jī)會(huì)再寫吧。對(duì)應(yīng)到MCU來說,其實(shí)就是timer嘛,RA8D1B里集成的timer多的是,各種口味的都有。對(duì)著RA8D1B的手冊(cè)寫clockevent/clocksource驅(qū)動(dòng)難度不大,但是,筆者這次想換個(gè)**,咱能不能利用arm自由的資源呢?我們知道arm M類cpu都有一個(gè)systick且支持中斷,所以理論上可以把它抽象成一個(gè)clockevent的。目前l(fā)inux內(nèi)核主線中把這個(gè)systick當(dāng)clocksource用的,不支持clockevent,它的代碼在drivers /clocksource /armv7m _ systick.c。咱給它改造改造整個(gè)容,經(jīng)筆者整容之后的armv7m _ systick.c眉清目秀,盤亮條順。
要看基本linux啟動(dòng)成功可用,最簡單的還是一個(gè)tty console。console用uart做比較簡單,這個(gè)RA8D1B里也有好幾個(gè)uart,而且特性豐富功能強(qiáng)大,而且似乎內(nèi)核中有一個(gè)同出一門眾芯片的串口驅(qū)動(dòng)drivers/tty/serial/sh-sci.c,但似乎寄存器不是太一致,所以接下來咱就對(duì)著手冊(cè)改寫串口驅(qū)動(dòng)嗎?NoNoNo,一般來說特性豐富功能強(qiáng)大就暗示著還是蠻復(fù)雜的,不信你去讀一讀sh-sci.c,咱能否粗糙猛方式搞定linux呢?咱又看上jlink了,它不是有個(gè)RTT (Real Time Terminal)么,既然號(hào)稱Real Time Terminal,代替?zhèn)€串口做console那是小菜一碟阿。但是Segger的RTT代碼不能直接用,因?yàn)镾DRAM有32MB,這么大空間都搜一遍么?而且別忘記Cortex-M85是可以帶有D-cache的,恰好RA8D1B里的這個(gè)M85就配置了D-Cache, linux肯定開啟cache了,RTT代碼注釋和文檔里對(duì)使能了cache這塊其實(shí)有很多的說明。筆者這>里換了一個(gè)思路,不要用SDRAM而是SRAM阿或者DTCM一部分來做RTT控制塊,DTCM是不經(jīng)cache的。另外為了通用性,咱們這里還需要使用DT(Device Tree)技術(shù)而不是hardcoding來設(shè)置RTT控制塊的地址,然后通過如下命令告訴jlink到哪里去找RTT控制塊:
exec SetRTTAddr 0x20000000
最后根據(jù)MCU和板級(jí)具體情況做個(gè)簡單的dts,主要就是告訴SDRAM起始地址阿大小阿什么的,還有上面說的rtt的設(shè)備節(jié)點(diǎn)。
至此,linux內(nèi)核層的事情搞定了,咱來搞定linux用戶層。
buildroot對(duì)NOMMU Linux支持得非常好,基本是拿來就用,buildroot使用方法網(wǎng)上也是很多的,前后>講完也是很費(fèi)時(shí)的,這里筆者也不多著筆墨了,因?yàn)閘inux userspace也不是主要目標(biāo)。這個(gè)步驟的輸>出是一個(gè)用busybox做的簡單rootfs,可以在內(nèi)核編譯時(shí)builtin進(jìn)去省去加載initrd/rootfs的過程。
上述dts編譯成一個(gè)dtb,重命名為dtb.bin,內(nèi)核(帶rootfs builtin)編譯成一個(gè)Image,重命名為Image.bin。
板子上電,燒錄前面講的bootloader,重啟板子,運(yùn)行jlink掛上去,運(yùn)行如下命令:
halt exec SetRTTAddr 0x20000000 loadfile /tmp/Image.bin 0x68008000 noreset loadfile /tmp/dtb.bin 0x68004000 noreset wreg "R15 (PC)" 0x68008001 wreg r0 0 wreg r2 0x68004000 go
第一個(gè)命令停止cpu,第二個(gè)命令是告訴jlink RTT控制塊地址,后面是加載內(nèi)核Image和跳轉(zhuǎn)內(nèi)核入口,至于為啥這么設(shè)置請(qǐng)參考arm linux內(nèi)核啟動(dòng)協(xié)議,網(wǎng)上很多,筆者不再贅述了。
再起一個(gè)shell運(yùn)行如下命令獲得RA8D1B的linux shell
telnet 127.0.0.1 19021
最后運(yùn)行NOMMU Linux的視頻供參考:
-
mcu
+關(guān)注
關(guān)注
146文章
17148瀏覽量
351186 -
Linux
+關(guān)注
關(guān)注
87文章
11304瀏覽量
209483 -
開發(fā)板
+關(guān)注
關(guān)注
25文章
5050瀏覽量
97456
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論