0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

嵌入式大牛的10年Bug調(diào)試經(jīng)驗(yàn)分享

5RJg_mcuworld ? 來源:陳翠 ? 2019-01-01 09:03 ? 次閱讀

作者十年來做過小的嵌入式系統(tǒng),大的電信系統(tǒng)以及基于web的系統(tǒng)。使用過C ++,Ruby,JavaPython等。這篇文章中的經(jīng)驗(yàn)教訓(xùn)旨在幫助減少編碼,測試和調(diào)試三個(gè)階段的bug。

下面這些都是會導(dǎo)致難點(diǎn)bug的問題:

1.事件順序。在處理事件時(shí),提出下列問題會很有成效:事件可以以不同的順序到達(dá)嗎?如果我們沒有接收到此事件會怎么樣?如果此事件接連發(fā)生兩次會怎么樣?哪怕通常不會發(fā)生,但系統(tǒng)(或交互系統(tǒng))其他部分的bug可能會導(dǎo)致事件發(fā)生呢。

2.過早。這是第一點(diǎn)“事件順序”的一個(gè)特例,但它確實(shí)會引起一些棘手的bug,因此我把它單獨(dú)拎出來說明。例如,如果信令消息在配置和啟動(dòng)程序完成之前就被過早接收,那么可能就會有很多奇怪的行為發(fā)生。另一個(gè)例子:連接在被放進(jìn)空閑列表之前就被標(biāo)記為down。在調(diào)試這類問題時(shí),我們總是假定在空閑列表中的時(shí)候連接被設(shè)置為down(但當(dāng)時(shí)為什么不把它放到列表外面呢?)。這是我們思考的不足,沒有考慮到有時(shí)候事情會過早發(fā)生。

3.悄無聲息的故障。一些最難跟蹤的bug有部分是由那些靜靜失敗并擴(kuò)展而不是拋出錯(cuò)誤的代碼所導(dǎo)致的。例如,沒有檢查代碼卻返回錯(cuò)誤的系統(tǒng)調(diào)用(如bind)。又如:解析代碼在它遇到錯(cuò)誤元素的時(shí)候只是返回而非拋出錯(cuò)誤。在錯(cuò)誤狀態(tài)中持續(xù)了一段時(shí)間的調(diào)用,會使調(diào)試變得更難。最好一旦檢測到故障就返回錯(cuò)誤。

4.If。有若干條件的if語句,if (a 或 b) ,特別是當(dāng)有鏈接的時(shí)候, if (x) else if (y),都給我引發(fā)了很多bug。即使if語句在概念上很簡單,但當(dāng)有多個(gè)條件要跟蹤的時(shí)候依然很容易出錯(cuò)。這些天,我嘗試重寫代碼使之更簡單,以避免處理復(fù)雜的if語句。

5.Else。有一些bug是因?yàn)闆]有正確考慮到如果條件為false時(shí)會發(fā)生什么而引起的。幾乎在所有的情況下,都應(yīng)該有一個(gè)else部分來應(yīng)對每一條if語句。此外,如果你在if語句的分支中設(shè)置變量,那么或許你在另一個(gè)分支中也要設(shè)置。與此種情況相關(guān)的是標(biāo)記被設(shè)置的情況。只添加用于設(shè)置的標(biāo)記的條件不難,但是很容易忘了添加當(dāng)標(biāo)記應(yīng)該再次重置時(shí)的條件。留下一個(gè)永遠(yuǎn)設(shè)置的標(biāo)志可能會導(dǎo)致之后接連不斷的bug。

6.改變假設(shè)。許多一開始最難預(yù)防的bug是因?yàn)楦淖兞思僭O(shè)所造成的。例如,在開始時(shí),可能每天只有一個(gè)客戶事件。于是很多代碼是在這樣的假設(shè)下寫下的。但是后來,設(shè)計(jì)改變了,允許每天有多個(gè)客戶事件了。發(fā)生這種情況時(shí),很難改變新設(shè)計(jì)影響到的所有情況。找到關(guān)于改變的所有顯式依賴關(guān)系不難,難的是要找到所有隱性依賴于舊的設(shè)計(jì)的情況。例如,可能會有獲取給定某一天所有客戶事件的代碼。其中的隱含假設(shè)是結(jié)果集永遠(yuǎn)不會超過客戶的數(shù)量。關(guān)于這方面的問題我也沒有很好的策略方法,如果各位有的話,還請不吝賜教。

7.日志記錄??梢暬绦蜃鍪裁粗陵P(guān)重要,特別是當(dāng)邏輯很復(fù)雜的時(shí)候。確保補(bǔ)充足夠多的(但不要太多)日志記錄,這樣你就可以說明為什么程序要這么做。如果一切正常,那也沒關(guān)系,但要是有問題發(fā)生,你會很慶幸自己添加了這些日志。

測試

作為一個(gè)開發(fā)人員,直到要測試了我才會去處理功能。至少,這意味著每一行新的或改變了的代碼行至少已經(jīng)被執(zhí)行過一次。此外,單元測試和功能測試都很不錯(cuò),但還不夠。新的功能也必須進(jìn)行測試,并在類似于產(chǎn)品的環(huán)境中探索。只有這樣,我才能說我完成了一個(gè)功能。下面是我經(jīng)歷過的bug所教會我的關(guān)于測試的一些重要的經(jīng)驗(yàn)教訓(xùn):

1.零和null。如果可行的話,確??偸怯昧愫蚽ull來測試。對于字符串,這意味著要測試長度為零的字符串以及字符串為null兩種情況。又如:測試TCP連接的斷開,要在發(fā)送數(shù)據(jù)給它發(fā)送之前。不使用這些組合方法測試是導(dǎo)致bug出現(xiàn)的首位原因。

2.添加和刪除。通常,新的功能包括能夠添加新的配置到系統(tǒng)中——例如,一個(gè)用于手機(jī)號碼轉(zhuǎn)換的新的配置文件。測試它能否添加新的配置文件是很自然的。但是,我發(fā)現(xiàn)我們很容易忘記去測試刪除配置文件是不是同樣ok。

3.錯(cuò)誤處理。處理錯(cuò)誤的代碼往往是難以測試的。最好有能檢查錯(cuò)誤處理代碼的自動(dòng)測試,但有時(shí)這是不可能的。我有時(shí)會使用的一招是臨時(shí)修改代碼,使得錯(cuò)誤處理代碼運(yùn)行起來。要做到這一點(diǎn)最簡單的方法是反轉(zhuǎn)if語句——例如,從if error_count > 0改成error_count == 0。另一個(gè)例子是拼錯(cuò)數(shù)據(jù)庫列名,從而導(dǎo)致期望的錯(cuò)誤處理代碼運(yùn)行。

4.隨機(jī)輸入。通常,揭露bug測試的一種測試方法是使用隨機(jī)輸入。例如,H.323協(xié)議的ASN.1解碼使用二進(jìn)制數(shù)據(jù)操作。通過發(fā)送隨機(jī)字節(jié)去解碼,我們發(fā)現(xiàn)了解碼器中的幾個(gè)bug。另一個(gè)例子是用測試呼叫來生成腳本,此時(shí)呼叫持續(xù)時(shí)間,接聽延遲,第一方掛斷等等都是隨機(jī)生成的。這些測試腳本會暴露許多bug,特別是一起發(fā)生的事件會產(chǎn)生并攏干擾。

5.檢查不應(yīng)該發(fā)生的動(dòng)作。通常測試包括檢查期望動(dòng)作是不是發(fā)生了。但我們很容易忽視相反的情況——忘記檢查不應(yīng)該發(fā)生的動(dòng)作是不是的確沒有發(fā)生。

6.擁有工具。我創(chuàng)建了自己的小工具,以使得測試更加簡單。例如,當(dāng)我用VoIP SIP協(xié)議工作時(shí),我寫了一個(gè)能夠用正是我想要的標(biāo)題和值回復(fù)的小腳本。這個(gè)工具使得測試很多邊界情況變得容易起來。另一個(gè)例子是可以進(jìn)行API調(diào)用的一個(gè)命令行工具。通過啟動(dòng)逐漸添加所需小功能,我得到了一些非常有用的工具。自己寫工具的好處是,我得到的正是我想要的。

在測試中發(fā)現(xiàn)所有的bug,那絕對是不可能的。有一個(gè)案例中,我更改了數(shù)字相關(guān)性的處理,數(shù)字由兩個(gè)部分組成:路由地址前綴(通常是不變的),以及從000到999動(dòng)態(tài)分配的數(shù)字。問題在于當(dāng)找到相關(guān)性時(shí),動(dòng)態(tài)分配的數(shù)字的第一個(gè)數(shù)字會在呈現(xiàn)在表格中之前遭到誤刪。也就是說637變成了37。這意味著,到100之前它都是可以工作的,因此,前面100個(gè)電話是正常的,但是接下來的900個(gè)都是失敗。所以,除非我在重新啟動(dòng)之前能夠測試超過100次(事實(shí)是我沒有),否則我在測試時(shí)就不會發(fā)現(xiàn)這個(gè)問題。

調(diào)試

1.討論。幫助我最多的調(diào)試技術(shù)是與同事討論問題。通常情況下,只是和同事說明問題,就會讓我意識到問題的癥結(jié)。此外,即使他們不是很熟悉有問題的代碼,他們也往往能提出一些好點(diǎn)子。與同事討論在處理最難的bug時(shí)特別有效。

2.密切關(guān)注。通常,如果調(diào)試問題花了很長時(shí)間,往往是因?yàn)槲易隽隋e(cuò)誤的假設(shè)。例如,我認(rèn)為問題發(fā)生在某一方法中,但事實(shí)卻是它甚至從來沒有到達(dá)那個(gè)方法?;蛘?,被拋出的異常不是我以為的那個(gè)?;蛘撸艺J(rèn)為軟件的最新版本上正在運(yùn)行,但其實(shí)是一個(gè)舊版本。因此,一定要核實(shí)細(xì)節(jié),而不是假設(shè)。人們更容易看到自己希望看到的東西,而不是事實(shí)。

3.最近的變化。當(dāng)曾經(jīng)可以正常工作的東西停止工作,那么這通常是因?yàn)樽罱淖兊臇|西所導(dǎo)致的。在一個(gè)案例中,最近的改變只是日志記錄,但是日志中的錯(cuò)誤卻導(dǎo)致了一個(gè)更大的問題。為了更容易找到這種回歸,承認(rèn)不同的提交會導(dǎo)致不同的變化,以及清楚說明這些更改會有所裨益。

4.相信用戶。有時(shí),當(dāng)用戶報(bào)告問題的時(shí)候,我的本能反應(yīng)是,“這是不可能的。一定是他們做錯(cuò)了什么事”。但我學(xué)會了不再用這種方式去回應(yīng)。更多的時(shí)間,事實(shí)往往證明,他們所報(bào)告的的確是實(shí)際發(fā)生的情況。因此,這些天,我開始接受他們所報(bào)告的內(nèi)容的表明價(jià)值。當(dāng)然,我依然會仔細(xì)檢查一切是否被正確地設(shè)置等等。我見過很多這樣的情況,讓我明白,因?yàn)椴粚こ5呐渲没蛞饬现獾挠梅ǘ鴮?dǎo)致不可思議的事情的發(fā)生,而我默認(rèn)的假設(shè)是,他們是正確的,程序是錯(cuò)誤的。

5.測試修復(fù)。如果bug修復(fù)已準(zhǔn)備就緒,那就必須進(jìn)行測試。首先在修復(fù)前運(yùn)行代碼,并觀察該bug。然后應(yīng)用修復(fù)并重復(fù)測試案例。到此為止錯(cuò)誤行為應(yīng)消失。遵循這些步驟可以確保它確實(shí)是一個(gè)bug,并且此次修復(fù)的確可以解決這個(gè)問題。簡單而有必要。

其他觀察結(jié)果

現(xiàn)在工作于C++時(shí)所遇到的幾類bug已經(jīng)完全消失,像堆棧溢出,內(nèi)存損壞,字符串問題和某種形式的內(nèi)存泄漏。

其他問題,如循環(huán)錯(cuò)誤和邊界情況,我看到的要少得多。但是,這并不意味著那里沒有bug。如果大家有什么有用的預(yù)防和發(fā)現(xiàn)bug的技術(shù)方法,歡迎留言。

作為過來人,最后還想說幾句心靈雞湯:

1、分享第一條經(jīng)驗(yàn):“學(xué)歷代表過去、能力代表現(xiàn)在、學(xué)習(xí)力代表未來?!?/p>

2、一定要確定自己的發(fā)展方向,并為此目的制定可行的計(jì)劃。

3、軟件開發(fā)團(tuán)隊(duì)中,技術(shù)不是萬能的,但沒有技術(shù)是萬萬不能的!

4、詳細(xì)制定自己軟件開發(fā)專業(yè)知識學(xué)習(xí)計(jì)劃,并注意及時(shí)修正和調(diào)整(軟件開發(fā)技術(shù)變化實(shí)在太快)。

5、書籍是人類進(jìn)步的階梯,對軟件開發(fā)人員尤其如此。

6、不要僅局限于對某項(xiàng)技術(shù)的表面使用上,哪怕你只是偶爾用一、二次。

7、在一種語言上編程,但別為其束縛了思想?!按a大全”中說:“深入一門語言編程,不要浮于表面”。

8、養(yǎng)成總結(jié)與反思的習(xí)慣,并有意識地提煉日常工作成果,形成自己的個(gè)人源碼庫、解決某類問題的通用系統(tǒng)體系結(jié)構(gòu)、甚至進(jìn)化為框架。

9、理論與實(shí)踐并重,內(nèi)外雙修。

10、心態(tài)有多開放,視野就有多開闊。

11、盡量參加開源項(xiàng)目的開發(fā)、或者與朋友共同研制一些自己的產(chǎn)品,千萬不要因?yàn)闆]有錢賺而不做。

12、書到用時(shí)方恨少,不要將自己的知識面僅僅局限于技術(shù)方面。

13、總結(jié)與反思:

(a)不要去做技術(shù)上的高手,除非你的目標(biāo)如此。雖然文章是關(guān)于提高軟件開發(fā)知識的,做技術(shù)的高手是我一向都不贊同的。你可以提高自己的專業(yè)知識,但能勝任工作即止。

(b)提高軟件知識和技術(shù)只是問題的表面,本質(zhì)是要提高自己認(rèn)識問題、分析問題、解決問題的思想高度。軟件專業(yè)知識的很多方法和原理,可以很容易地延伸、應(yīng)用到生活的其它方面。

(c)在能勝任工作的基礎(chǔ)上,立即去涉獵其它領(lǐng)域的專業(yè)知識,豐富自己的知識體系、提高自己的綜合素質(zhì),尤其是那些目標(biāo)不在技術(shù)方面的朋友。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 嵌入式
    +關(guān)注

    關(guān)注

    5082

    文章

    19126

    瀏覽量

    305195
  • 嵌入式系統(tǒng)
    +關(guān)注

    關(guān)注

    41

    文章

    3593

    瀏覽量

    129473

原文標(biāo)題:嵌入式大牛的10年Bug調(diào)試經(jīng)驗(yàn),收獲頗多!

文章出處:【微信號:mcuworld,微信公眾號:嵌入式資訊精選】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    幾位嵌入式技術(shù)大牛嵌入式操作系統(tǒng)那么多,如何選擇?

    物聯(lián)網(wǎng)、人工智能的發(fā)展都離不開嵌入式系統(tǒng),工程師對嵌入式操作系統(tǒng)的要求也由簡單易用上升到既要簡單易用又安全可靠。嵌入式操作系統(tǒng)那么多,到底哪一個(gè)才適合工程師的應(yīng)用呢?《單片機(jī)與嵌入式
    的頭像 發(fā)表于 09-11 14:57 ?2.1w次閱讀

    誠聘嵌入式系統(tǒng)工程師

    ; 4、 負(fù)責(zé)項(xiàng)目設(shè)計(jì)文檔的編寫和程序BUG的跟蹤與修復(fù)。任職資格: 1、 本科及以上學(xué)歷 計(jì)算機(jī)、自動(dòng)化、電子類相關(guān)專業(yè);工作經(jīng)驗(yàn)3-5以上; 2、熟悉嵌入式系統(tǒng)軟硬件的系統(tǒng)設(shè)計(jì),
    發(fā)表于 10-10 15:44

    10嵌入式工程師總結(jié)的Bug調(diào)試經(jīng)驗(yàn)

    本文轉(zhuǎn)自網(wǎng)絡(luò),版權(quán)歸原作者所有。這十來我做過小的嵌入式系統(tǒng),大的電信系統(tǒng)以及基于web的系統(tǒng)。使用過C ++,Ruby,Java和Python等。這篇文章中的經(jīng)驗(yàn)教訓(xùn)旨在幫助減少編碼,測試和
    發(fā)表于 12-30 18:56

    10Bug調(diào)試經(jīng)驗(yàn)分享!

    嵌入式碼農(nóng)的10Bug調(diào)試經(jīng)驗(yàn)!圖文詳情在附件嵌入式
    發(fā)表于 10-29 03:17

    嵌入式Bug調(diào)試經(jīng)驗(yàn)匯總

    來源:互聯(lián)網(wǎng)總有一些工程師吐槽嵌入式有多難學(xué),Bug調(diào)試不知從何下手!今天小編就給大家分享一位嵌入式技術(shù)大牛
    發(fā)表于 10-22 09:39

    嵌入式大牛開發(fā)經(jīng)驗(yàn)心得

    招聘做物流的人去做軟件,如果您做的是機(jī)械設(shè)計(jì),當(dāng)然用人單位也不會讓您去做51的開發(fā); 然而,第一份工作能不能做嵌入式開發(fā),首先是您能不能在大學(xué)的4內(nèi)取得先手之利;先取得一些嵌入式開發(fā)的經(jīng)驗(yàn)
    發(fā)表于 11-18 10:30

    請教嵌入式系統(tǒng)交叉調(diào)試原理和方法是什么?

    請教一下大牛,嵌入式系統(tǒng)交叉調(diào)試原理和方法是什么呀?大家都說嵌入式系統(tǒng)交叉調(diào)試方法一般分為兩種,一種是基于JTAG的片上
    發(fā)表于 03-05 07:55

    嵌入式開發(fā)調(diào)試經(jīng)驗(yàn)分享

    嵌入式開發(fā)過程中的一點(diǎn)調(diào)試經(jīng)驗(yàn)嵌入式開發(fā)最麻煩的在現(xiàn)場調(diào)試過程中或?qū)嶋H運(yùn)營過程中出現(xiàn)問題很難定位。我在實(shí)際開發(fā)過程中一點(diǎn)
    發(fā)表于 11-05 08:15

    嵌入式系統(tǒng)的遠(yuǎn)程調(diào)試

      1 基本方法   圖1(a)是傳統(tǒng)的嵌入式調(diào)試方法:主機(jī)PC通過串口與從機(jī)嵌入式系統(tǒng)相連,接收從嵌入式系統(tǒng)發(fā)來的調(diào)試信息并向
    發(fā)表于 08-30 10:23 ?1034次閱讀
    <b class='flag-5'>嵌入式</b>系統(tǒng)的遠(yuǎn)程<b class='flag-5'>調(diào)試</b>

    嵌入式培訓(xùn)怎么學(xué)?嵌入式工作的優(yōu)勢

    初入門的嵌入式開發(fā)人員年薪一般都能達(dá)到4-9萬元,有3以上經(jīng)驗(yàn)的人員年薪都在10萬元以上,有10
    的頭像 發(fā)表于 11-09 09:36 ?7584次閱讀

    進(jìn)行編碼、測試和調(diào)試三個(gè)階段時(shí)如何減少bug

    這十來我做過小的嵌入式系統(tǒng),大的電信系統(tǒng)以及基于web的系統(tǒng)。使用過C ++,Ruby,Java和Python等。這篇文章中的經(jīng)驗(yàn)教訓(xùn)旨在幫助減少編碼、測試和調(diào)試三個(gè)階段的
    的頭像 發(fā)表于 02-11 16:52 ?3257次閱讀

    如何實(shí)現(xiàn)嵌入式系統(tǒng)遠(yuǎn)程調(diào)試

    嵌入式系統(tǒng)隨著目前科技的發(fā)展,正逐步融入人們的生活中。對于嵌入式系統(tǒng),我們應(yīng)該有所了解。就專業(yè)人員而言,他們對嵌入式系統(tǒng)早已駕輕就熟。為增進(jìn)大家對嵌入式系統(tǒng)的認(rèn)識,本文將對
    的頭像 發(fā)表于 11-22 11:55 ?5356次閱讀
    如何實(shí)現(xiàn)<b class='flag-5'>嵌入式</b>系統(tǒng)遠(yuǎn)程<b class='flag-5'>調(diào)試</b>

    嵌入式LINUX系統(tǒng)內(nèi)核和內(nèi)核模塊調(diào)試

    嵌入式LINUX系統(tǒng)內(nèi)核和內(nèi)核模塊調(diào)試(嵌入式開發(fā)和硬件開發(fā))-嵌入式LINUX系統(tǒng)內(nèi)核和內(nèi)核模塊調(diào)試? ? ? ? ? ? ? ? ?
    發(fā)表于 07-30 13:55 ?10次下載
    <b class='flag-5'>嵌入式</b>LINUX系統(tǒng)內(nèi)核和內(nèi)核模塊<b class='flag-5'>調(diào)試</b>

    嵌入式開發(fā)過程中的一點(diǎn)調(diào)試經(jīng)驗(yàn)

    嵌入式開發(fā)過程中的一點(diǎn)調(diào)試經(jīng)驗(yàn)嵌入式開發(fā)最麻煩的在現(xiàn)場調(diào)試過程中或?qū)嶋H運(yùn)營過程中出現(xiàn)問題很難定位。我在實(shí)際開發(fā)過程中一點(diǎn)
    發(fā)表于 11-02 18:06 ?15次下載
    <b class='flag-5'>嵌入式</b>開發(fā)過程中的一點(diǎn)<b class='flag-5'>調(diào)試</b><b class='flag-5'>經(jīng)驗(yàn)</b>

    嵌入式大牛10調(diào)Bug經(jīng)驗(yàn)總結(jié)

    這十來我做過小的嵌入式系統(tǒng),大的電信系統(tǒng)以及基于web的系統(tǒng)。使用過C ++,Ruby,Java和Python等。這篇文章中的經(jīng)驗(yàn)教訓(xùn)旨在幫助減少編碼,測試和調(diào)試三個(gè)階段的
    發(fā)表于 02-10 10:07 ?1次下載
    <b class='flag-5'>嵌入式</b><b class='flag-5'>大牛</b><b class='flag-5'>10</b><b class='flag-5'>年</b>調(diào)<b class='flag-5'>Bug</b><b class='flag-5'>經(jīng)驗(yàn)</b>總結(jié)