0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

非常硬核的嵌入式開發(fā)常見的問題解決方法總結(jié)

嵌入式情報(bào)局 ? 來源:嵌入式情報(bào)局 ? 2023-10-11 17:48 ? 次閱讀

一、問題復(fù)現(xiàn)

穩(wěn)定復(fù)現(xiàn)問題才能正確的對問題進(jìn)行定位、解決以及驗(yàn)證。一般來說,越容易復(fù)現(xiàn)的問題越容易解決。

1.1 模擬復(fù)現(xiàn)條件

有的問題存在于特定的條件下,只需要模擬出現(xiàn)問題的條件即可復(fù)現(xiàn)。對于依賴外部輸入的條件,如果條件比較復(fù)雜難以模擬可以考慮程序里預(yù)設(shè)直接進(jìn)入對應(yīng)狀態(tài)。

1.2 提高相關(guān)任務(wù)執(zhí)行頻率

例如某個(gè)任務(wù)長時(shí)間運(yùn)行才出現(xiàn)異常則可以提高該任務(wù)的執(zhí)行頻率。

1.3 增大測試樣本量

程序長時(shí)間運(yùn)行后出現(xiàn)異常,問題難以復(fù)現(xiàn),可以搭建測試環(huán)境多套設(shè)備同時(shí)進(jìn)行測試。

二、問題定位

縮小排查范圍,確認(rèn)引入問題的任務(wù)、函數(shù)、語句。

2.1 打印LOG

根據(jù)問題的現(xiàn)象,在抱有疑問的代碼處增加LOG輸出,以此來追蹤程序執(zhí)行流程以及關(guān)鍵變量的值,觀察是否與預(yù)期相符。

2.2 在線調(diào)試

在線調(diào)試可以起到和打印LOG類似的作用,另外此方法特別適合排查程序崩潰類的BUG,當(dāng)程序陷入異常中斷(HardFault,看門狗中斷等)的時(shí)候可以直接STOP查看call stack以及內(nèi)核寄存器的值,快速定位問題點(diǎn)。

2.3 版本回退

使用版本管理工具時(shí)可以通過不斷回退版本并測試驗(yàn)證來定位首次引入該問題的版本,之后可以圍繞該版本增改的代碼進(jìn)行排查。

2.4 二分注釋

二分注釋即以類似二分查找法的方式注釋掉部分代碼,以此判斷問題是否由注釋掉的這部分代碼引起。

具體方法為將與問題不相干的部分代碼注釋掉一半,看問題是否解決,未解決則注釋另一半,如果解決則繼續(xù)將注釋范圍縮小一半,以此類推逐漸縮小問題的范圍。

2.5 保存內(nèi)核寄存器快照

Cortex M內(nèi)核陷入異常中斷時(shí)會(huì)將幾個(gè)內(nèi)核寄存器的值壓入棧中,如下圖:

ec9d6c34-680e-11ee-939d-92fbcf53809c.png

我們可以在陷入異常中斷時(shí)將棧上的內(nèi)核寄存器值寫入RAM的一段復(fù)位后保留默認(rèn)值的區(qū)域內(nèi),執(zhí)行復(fù)位操作后再從RAM將該信息讀出并分析,通過PC、LR確認(rèn)當(dāng)時(shí)執(zhí)行的函數(shù),通過R0-R3分析當(dāng)時(shí)處理的變量是否異常,通過SP分析是否可能出現(xiàn)棧溢出等。

三、問題分析處理

結(jié)合問題現(xiàn)象以及定位的問題代碼位置分析造成問題的原因。

3.1 程序繼續(xù)運(yùn)行

3.1.1 數(shù)值異常

3.1.1.1 軟件問題

1、數(shù)組越界

寫數(shù)組時(shí)下標(biāo)超出數(shù)組長度,導(dǎo)致對應(yīng)地址內(nèi)容被修改。如下:

eca543a0-680e-11ee-939d-92fbcf53809c.png

此類問題通常需要結(jié)合map文件進(jìn)行分析,通過map文件觀察被篡改變量地址附近的數(shù)組,查看對該數(shù)組的寫入操作是否存在如上圖所示不安全的代碼,將其修改為安全的代碼。

2、棧溢出

0x20001ff8 g_val
0x20002000 棧底
………… ??臻g
0x20002200 棧頂

如上圖,此類問題也需要結(jié)合map文件進(jìn)行分析。假設(shè)棧從高地址往低地址增長,如果發(fā)生棧溢出,則g_val的值會(huì)被棧上的值覆蓋。

出現(xiàn)棧溢出時(shí)要分析棧的最大使用情況,函數(shù)調(diào)用層數(shù)過多,中斷服務(wù)函數(shù)內(nèi)進(jìn)行函數(shù)調(diào)用,函數(shù)內(nèi)部申明了較大的臨時(shí)變量等都有可能導(dǎo)致棧溢出。

解決此類問題有以下方法:

  • 在設(shè)計(jì)階段應(yīng)該合理分配內(nèi)存資源,為棧設(shè)置合適的大??;

  • 將函數(shù)內(nèi)較大的臨時(shí)變量加”static”關(guān)鍵字轉(zhuǎn)化為靜態(tài)變量,或者使用malloc()動(dòng)態(tài)分配,將其放到堆上;

  • 改變函數(shù)調(diào)用方式,降低調(diào)用層數(shù)。

3、判斷語句條件寫錯(cuò)

ecb7b846-680e-11ee-939d-92fbcf53809c.png

判斷語句的條件容易把相等運(yùn)算符“==”寫成賦值運(yùn)算符“=”導(dǎo)致被判斷的變量值被更改,該類錯(cuò)誤編譯期不會(huì)報(bào)錯(cuò)且總是返回真。

建議將要判斷的變量寫到運(yùn)算符的右邊,這樣錯(cuò)寫為賦值運(yùn)算符時(shí)會(huì)在編譯期報(bào)錯(cuò)。還可以使用一些靜態(tài)代碼檢查工具來發(fā)現(xiàn)此類問題。

4、同步問題

例如操作隊(duì)列時(shí),出隊(duì)操作執(zhí)行的過程中發(fā)生中斷(任務(wù)切換),并且在中斷(切換后的任務(wù))中執(zhí)行入隊(duì)操作則可能破壞隊(duì)列結(jié)構(gòu),對于這類情況應(yīng)該操作時(shí)關(guān)中斷(使用互斥鎖同步)。

5、優(yōu)化問題

ecc462e4-680e-11ee-939d-92fbcf53809c.png

如上圖程序,本意是等待irq中斷之后不再執(zhí)行foo()函數(shù),但被編譯器優(yōu)化之后,實(shí)際運(yùn)行過程中flg可能被裝入寄存器并且每次都判斷寄存器內(nèi)的值而不重新從ram里讀取flg的值,導(dǎo)致即使irq中斷發(fā)生foo()也一直運(yùn)行,此處需要在flg的申明前加“volatile”關(guān)鍵字,強(qiáng)制每次都從ram里獲取flg的值。

3.1.1.2 硬件問題

1、芯片BUG

芯片本身存在BUG,在某些特定情況下給單片機(jī)返回一個(gè)錯(cuò)誤的值,需要程序?qū)ψx回的值進(jìn)行判斷,過濾異常值。

2、通信時(shí)序錯(cuò)誤

ecd3d3aa-680e-11ee-939d-92fbcf53809c.png

例如電源管理芯片Isl78600,假設(shè)現(xiàn)在兩片級聯(lián),當(dāng)同時(shí)讀取兩片的電壓采樣數(shù)據(jù)時(shí),高端芯片會(huì)以固定周期通過菊花鏈將數(shù)據(jù)傳送到低端芯片,而低端芯片上只有一個(gè)緩存區(qū).

如果單片機(jī)不在規(guī)定時(shí)間內(nèi)將低端芯片上的數(shù)據(jù)讀走那么新的數(shù)據(jù)到來時(shí)將會(huì)覆蓋當(dāng)前數(shù)據(jù),導(dǎo)致數(shù)據(jù)丟失。此類問題需要仔細(xì)分析芯片的數(shù)據(jù)手冊,嚴(yán)格滿足芯片通信的時(shí)序要求。

3.1.2 動(dòng)作異常

3.1.2.1 軟件問題

1、設(shè)計(jì)問題

設(shè)計(jì)中存在錯(cuò)誤或者疏漏,需要重新評審設(shè)計(jì)文檔。

2、實(shí)現(xiàn)與設(shè)計(jì)不符

代碼的實(shí)現(xiàn)與設(shè)計(jì)文檔不相符需要增加單元測試覆蓋所有條件分支,進(jìn)行代碼交叉review。

3、狀態(tài)變量異常

例如記錄狀態(tài)機(jī)當(dāng)前狀態(tài)的變量被篡改,分析該類問題的方法同前文數(shù)值異常部分。

3.1.2.2 硬件問題

1、硬件失效

目標(biāo)IC失效,接收控制指令后不動(dòng)作,需要排查硬件。

2、通信異常

與目標(biāo)IC通信錯(cuò)誤,無法正確執(zhí)行控制命令,需要使用示波器或邏輯分析儀去觀察通信時(shí)序,分析是否發(fā)出的信號不對或者受到外部干擾。

3.2 程序崩潰

3.2.1 停止運(yùn)行

3.2.1.1 軟件問題

1、HardFault

以下情況會(huì)造成HardFault:

  • 在外設(shè)時(shí)鐘門未使能的情況下操作該外設(shè)的寄存器;

  • 跳轉(zhuǎn)函數(shù)地址越界,通常發(fā)生在函數(shù)指針被篡改,排查方法同數(shù)值異常;

  • 解引用指針時(shí)出現(xiàn)對齊問題:

以小端序?yàn)槔?,如果我們聲明了一個(gè)強(qiáng)制對齊的結(jié)構(gòu)體如下:

ece37a08-680e-11ee-939d-92fbcf53809c.png
地址 0x00000000 0x00000001 0x00000002 0x00000003
變量名 Val0 Val1_low Val1_high Val2
0x12 0x56 0x34 0x78

此時(shí)a.val1的地址為0x00000001,如果以uint16_t類型去解引用此地址則會(huì)因?yàn)閷R問題進(jìn)入HardFault,如果一定要用指針方式操作該變量則應(yīng)當(dāng)使用memcpy()。

2、中斷服務(wù)函數(shù)中未清除中斷標(biāo)志

中斷服務(wù)函數(shù)退出前不正確清除中斷標(biāo)志,當(dāng)程序執(zhí)行從中斷服務(wù)函數(shù)內(nèi)退出后又會(huì)立刻進(jìn)入中斷服務(wù)函數(shù),表現(xiàn)出程序的“假死”現(xiàn)象。

3、NMI中斷

調(diào)試時(shí)曾遇到SPI的MISO引腳復(fù)用NMI功能,當(dāng)通過SPI連接的外設(shè)損壞時(shí)MISO被拉高,導(dǎo)致單片機(jī)復(fù)位后在把NMI引腳配置成SPI功能之前就直接進(jìn)入NMI中斷,程序掛死在NMI中斷中。這種情況可以在NMI的中斷服務(wù)函數(shù)內(nèi)禁用NMI功能來使其退出NMI中斷。

3.2.1.2 硬件問題

1、晶振未起振

2、供電電壓不足

3、復(fù)位引腳拉低

3.2 .2 復(fù)位

3.2.2.1 軟件問題

1、看門狗復(fù)位

除了喂狗超時(shí)導(dǎo)致的復(fù)位以外,還要注意看門狗配置的特殊要求,以Freescale KEA單片機(jī)為例,該單片機(jī)看門狗在配置時(shí)需要執(zhí)行解鎖序列(向其寄存器連續(xù)寫入兩個(gè)不同的值),該解鎖序列必須在16個(gè)總線時(shí)鐘內(nèi)完成,超時(shí)則會(huì)引起看門狗復(fù)位。此類問題只能熟讀單片機(jī)數(shù)據(jù)手冊,注意類似的細(xì)節(jié)問題。

3.2.2.2 硬件問題

1、供電電壓不穩(wěn)

2、電源帶載能力不足

四、回歸測試

問題解決后需要進(jìn)行回歸測試,一方面確認(rèn)問題是否不再復(fù)現(xiàn),另一方面要確認(rèn)修改不會(huì)引入其他問題。

五、經(jīng)驗(yàn)總結(jié)

總結(jié)本次問題產(chǎn)生的原因及解決問題的方法,思考類似問題今后如何防范,對相同平臺(tái)產(chǎn)品是否值得借鑒,做到舉一反三,從失敗中吸取經(jīng)驗(yàn)。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 寄存器
    +關(guān)注

    關(guān)注

    31

    文章

    5357

    瀏覽量

    120614
  • 嵌入式開發(fā)
    +關(guān)注

    關(guān)注

    18

    文章

    1033

    瀏覽量

    47604
  • Log
    Log
    +關(guān)注

    關(guān)注

    0

    文章

    14

    瀏覽量

    11345

原文標(biāo)題:非常硬核的嵌入式開發(fā)常見的問題解決方法總結(jié)~

文章出處:【微信號:嵌入式情報(bào)局,微信公眾號:嵌入式情報(bào)局】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    通信電源系統(tǒng)維護(hù)要求及常見問題解決方法(6)

    通信電源系統(tǒng)維護(hù)要求及常見問題解決方法(6)
    發(fā)表于 08-20 12:16

    Linux嵌入式系統(tǒng)初學(xué)者的常見問題解決方法大全

    該文檔為Linux嵌入式系統(tǒng)初學(xué)者的常見問題解決方法大全(Linux學(xué)習(xí)指引篇)講解文檔,是一份不錯(cuò)的參考資料,感興趣的可以下載看看
    發(fā)表于 10-16 16:12

    嵌入式開發(fā)中的常見問題

    嵌入式開發(fā)中的常見問題小總結(jié)
    發(fā)表于 02-25 07:49

    基于ARM的嵌入式開發(fā)

    基于ARM的嵌入式開發(fā):華清遠(yuǎn)見/孫天澤基于ARM的嵌入式開發(fā)內(nèi)容有:ARM簡介,基于ARM的嵌入式產(chǎn)品,ARM架構(gòu),基于ARM的嵌入式開發(fā)
    發(fā)表于 10-04 08:49 ?83次下載

    按鈕數(shù)字電位器的防抖動(dòng)和重復(fù)動(dòng)作問題解決方法

    按鈕數(shù)字電位器的防抖動(dòng)和重復(fù)動(dòng)作問題解決方法 介紹按鈕數(shù)字電位器的防抖動(dòng)和重復(fù)動(dòng)作問題的一種解決方法,以及對數(shù)字電位器電壓、電流、級
    發(fā)表于 04-05 09:26 ?3021次閱讀
    按鈕<b class='flag-5'>式</b>數(shù)字電位器的防抖動(dòng)和重復(fù)動(dòng)作<b class='flag-5'>問題解決方法</b>

    通信電源系統(tǒng)維護(hù)要求及常見問題解決方法

    通信電源系統(tǒng)維護(hù)要求及常見問題解決方法
    發(fā)表于 11-08 17:07 ?101次下載

    嵌入式開發(fā)

    嵌入式開發(fā)就是指在嵌入式操作系統(tǒng)下進(jìn)行開發(fā),嵌入式Linux是以Linux為基礎(chǔ)的嵌入式作業(yè)系統(tǒng)。這里提供了
    發(fā)表于 12-20 13:21
    <b class='flag-5'>嵌入式開發(fā)</b>

    基于MPC7448的高端PowerPC常見問題解決方法

    基于MPC7448的高端PowerPC常見問題解決方法
    發(fā)表于 09-23 17:16 ?46次下載

    通用智能后視鏡常見問題解決方法

    通用后視鏡常見問題解決方法以及高德地圖的下載和安裝方法
    發(fā)表于 11-17 15:37 ?23次下載

    嵌入式開發(fā)的產(chǎn)品有哪些_嵌入式開發(fā)的流程

    本文主要闡述了嵌入式開發(fā)的產(chǎn)品,其次介紹了嵌入式開發(fā)的流程。
    發(fā)表于 08-31 15:38 ?1.1w次閱讀

    嵌入式開發(fā)前景怎么樣?嵌入式開發(fā)有哪些優(yōu)勢?

    嵌入式開發(fā)行業(yè)近年來受關(guān)注度是越來越高,不過在關(guān)注度高的前提下還是有些人沒有那么了解嵌入式。其實(shí)嵌入式技術(shù)早已經(jīng)進(jìn)入我們的生活當(dāng)中,比如說最常見的智能手機(jī)、智能電視、智能家電等等,那么
    發(fā)表于 10-20 14:50 ?2次下載
    <b class='flag-5'>嵌入式開發(fā)</b>前景怎么樣?<b class='flag-5'>嵌入式開發(fā)</b>有哪些優(yōu)勢?

    嵌入式開發(fā)資料免費(fèi)分享

    嵌入式開發(fā)資料免費(fèi)分享嵌入式工程師經(jīng)驗(yàn)分享:如何學(xué)習(xí)嵌入式開發(fā)截取文檔部分學(xué)習(xí)嵌入式工程師經(jīng)驗(yàn)分享的資料分享給大家,文檔上從、嵌入式系統(tǒng)的概
    發(fā)表于 10-21 11:07 ?47次下載
    <b class='flag-5'>嵌入式開發(fā)</b>資料免費(fèi)分享

    學(xué)習(xí)嵌入式開發(fā)前景問題解

    對于想轉(zhuǎn)行的白領(lǐng)或者是剛步入社會(huì)的大學(xué)生來說,選擇學(xué)習(xí)嵌入式開發(fā)僅僅是一個(gè)開端,不管是大家有創(chuàng)業(yè)的想法,還是想成為一名優(yōu)秀的嵌入式開發(fā)工程師,都要學(xué)好嵌入式開發(fā)。上海尚觀科技致力于嵌入式開發(fā)
    發(fā)表于 11-03 14:21 ?8次下載
    學(xué)習(xí)<b class='flag-5'>嵌入式開發(fā)</b>前景問<b class='flag-5'>題解</b>答

    PCB壓合問題解決方法

    PCB壓合問題解決方法
    的頭像 發(fā)表于 01-05 10:32 ?1084次閱讀

    嵌入式開發(fā)常見問題排查

    歸結(jié)為相對簡單的小問題。接下來,我們將討論一些嵌入式開發(fā)常見的問題及其解決方法。一、問題復(fù)現(xiàn)要有效解決問題,首先需要能夠穩(wěn)定地復(fù)現(xiàn)它。一般來說,容易復(fù)現(xiàn)的問題也相對
    的頭像 發(fā)表于 09-22 08:04 ?353次閱讀
    <b class='flag-5'>嵌入式開發(fā)</b><b class='flag-5'>常見</b>問題排查