大學(xué)畢業(yè)被分配到某研究所工作,入職后先后跟著羅、高以及張師傅學(xué)習(xí)電子硬件設(shè)計以及匯編、C語言等編程。在各位老師的精心指導(dǎo)下,通過實踐和培訓(xùn),終于開始成長為一名電子技術(shù)工程師。
進(jìn)所第二年,盛夏,開始參與一項系統(tǒng)的研發(fā)工作,項目當(dāng)時很急,系統(tǒng)的技術(shù)負(fù)責(zé)人是張主任,其他的成員包括小柴、小倪等,都比較年輕。系統(tǒng)采用多DSP分布式控制,通過總線插卡擴展。我主要負(fù)責(zé)底層的數(shù)據(jù)采集、處理并存儲到雙口RAM中。
項目一開始進(jìn)展良好,硬件設(shè)計調(diào)試和軟件編寫調(diào)試都按照預(yù)期進(jìn)行。在進(jìn)入系統(tǒng)聯(lián)調(diào)后,項目被卡住了。我設(shè)計的板卡存儲到雙口RAM后,上位機讀取錯誤,上位機通過雙口RAM發(fā)給我的數(shù)據(jù)讀取出來也不正確。這個問題整整折磨了我們好幾天,期間做了大量的測試和仿真,始終找不出任何頭緒。隨著時間推移,項目組的氣氛開始越來越緊張。問題是各自檢查自己的設(shè)計和仿真數(shù)據(jù)都是正確的,一旦聯(lián)調(diào)就不正確。開分析會時除了張主任依然是樂呵呵的調(diào)節(jié)氣氛外,其他人都很焦慮。由于我的資歷最淺,無形之中承擔(dān)更大壓力。
洛陽的夏天,白天很熱,晚上沒有空調(diào)的宿舍也是悶熱難耐。夜里快12點了和老婆在宿舍樓下小花園乘涼。聊到項目被卡,數(shù)據(jù)總是出錯時,老婆不經(jīng)意說了一句“會不會是數(shù)據(jù)放錯地方了”,突然靈光一現(xiàn),馬上騎上自行車直奔實驗室,幾分鐘后就找到問題并得到驗證,其實這只是因為系統(tǒng)設(shè)計中一個小疏忽導(dǎo)致的,很難說是誰的問題。問題找到了一切迎刃而解,第二天系統(tǒng)聯(lián)調(diào)順利過關(guān),項目按照計劃準(zhǔn)時移交給需求方。
二十多年了,這件事始終縈繞在我腦海,讓我獲益良多:
1)項目越緊,項目負(fù)責(zé)人越要有定力,每當(dāng)我負(fù)責(zé)的項目卡殼項目組人心浮動時,我就想起張主任的微笑,心情也馬上會平靜下來;
2)團隊協(xié)助工作,涉及到系統(tǒng)級別的設(shè)計和聯(lián)調(diào)時,表面上很奇怪的問題可能只是一點點的疏忽導(dǎo)致,既不能輕易懷疑別人的問題,也不能不信任自己的分析。遇到問題還是需要一點點抽絲剝繭,共同應(yīng)對。現(xiàn)在不管遇到多么詭異的問題,我都會告誡團隊成員,不要輕易說“絕不可能”等類似的話;
3)有時遇到技術(shù)上特別難理解和解決的問題,和所謂的外行聊聊天,沒準(zhǔn)會有意想不到的收獲;其實在和外行解釋的過程遠(yuǎn)比和內(nèi)行解釋困難,一件事情你能和外行解釋清楚,必然要求你自己深入理解,在解釋的過程中有些問題的答案自然就跑出來了。這些年來我經(jīng)常采用打比方舉例子等方式和非專業(yè)人士交流,效果往往很好。
4)勤奮真的很重要,特別是年輕人,不輕言放棄,遇事有鉆研精神是技術(shù)上能有所成就的基本要求。只有親身經(jīng)歷過一些磨難,才能終身受用。
2001年3月,因機緣巧合,我入職了A公司,主要從事指紋識別算法研究和相關(guān)產(chǎn)品開發(fā)銷售。在美國911事件之前,指紋識別產(chǎn)品屬于比較高冷的行業(yè),屬于很小眾的高科技行業(yè),單臺產(chǎn)品售價和毛利率很高,但是銷量很小。
我剛?cè)肼殨r是硬件工程師,參與指紋考勤門禁系統(tǒng)的研發(fā)工作,門禁系統(tǒng)研發(fā)完成后開始負(fù)責(zé)指紋門鎖的軟硬件研發(fā)工作。經(jīng)過一段時間的研發(fā)后,基于指紋技術(shù)的門禁考勤機開始小規(guī)模生產(chǎn)銷售。而且有兩臺銷往東北地區(qū),好像是沈陽的一家國企采購的。剛開始一切都很完美,畢竟有了客戶而且每臺有好幾千元的利潤。
沒多久客戶就打電話來投訴說考勤機壞了,因為涉及很多人的考勤問題,客戶要求立即派人帶上備用機器盡快趕過去更換。公司領(lǐng)導(dǎo)立即派了兩個現(xiàn)場技術(shù)支持工程師乘飛機趕往東北,同時我們研發(fā)團隊也緊急研討故障的原因,但一時之間也沒有頭緒。
經(jīng)過緊急處理更換后,兩個人帶著故障機趕回公司。拆開外殼后,大家發(fā)現(xiàn)原來是因為模具設(shè)計存在缺陷,電路板線纜的固定方式不太合理。加上裝配工的疏忽,其中一根導(dǎo)線沒有固定好,在扣上外殼時被壓在卡槽里。由于卡槽扣合的力度很大,這根導(dǎo)線外皮已經(jīng)破損,部分銅芯已經(jīng)斷裂,但沒有完全斷掉。因此出廠檢驗時一切正常。經(jīng)過長途運輸顛簸,加上考勤機是用在室外,東北地區(qū)的夜晚很冷,塑料外殼的收縮率遠(yuǎn)高于導(dǎo)線。就這樣,一段時間后,這根導(dǎo)線就徹底斷了,整個考勤機就壞掉了。
查明原因后,令人撓頭的是沒人知道剛剛更換的那臺機器是否也存在同樣的問題,不得已,公司領(lǐng)導(dǎo)又派人帶著改進(jìn)后的產(chǎn)品再赴東北進(jìn)行更換。事后領(lǐng)導(dǎo)說這次兩臺機器的利潤還不夠人員兩次往返的費用。
從此以后,但凡有電路板上接插件和導(dǎo)線需要和外殼配合時,我都會要求結(jié)構(gòu)工程師一定要認(rèn)真考慮線纜的走向和線束的固定問題,而且對于生產(chǎn)線的裝配工藝反復(fù)核查,裝配人員進(jìn)行專業(yè)培訓(xùn)。
這些年來,看過很多故障電子產(chǎn)品,發(fā)現(xiàn)因結(jié)構(gòu)裝配不合理導(dǎo)致線纜松動、斷裂等問題依然比較常見,電子產(chǎn)品的不良率中源于接插件和導(dǎo)線的部分占比很高。用過翻蓋手機的很多人應(yīng)該都有過換線的經(jīng)歷,家中的很多電器故障往往都是接插件松動接觸不良。這類看似不起眼的小事從小處說可能是產(chǎn)品故障,客戶投訴,從大處說可能導(dǎo)致機毀人亡。
作為電子工程師,這件事給我上了非常重要的一課,讓我從此重視結(jié)構(gòu)和線纜等小細(xì)節(jié)對產(chǎn)品的影響。
2005年,我在B公司擔(dān)任hardware leader,負(fù)責(zé)寬帶通信局端及終端設(shè)備硬件研發(fā)工作。B公司是日本C公司的全資子公司,也是它在國內(nèi)設(shè)立的唯一的研發(fā)中心,日本C公司當(dāng)時是全球最大的寬帶通信設(shè)備供應(yīng)商。
我們采用博通的方案成功開發(fā)出工業(yè)級ADSL局端和終端設(shè)備,該設(shè)備基于日本標(biāo)準(zhǔn)并主要應(yīng)用于日本市場,當(dāng)時已完成VCCI ClassA測試認(rèn)證,正準(zhǔn)備在日本工廠批量試生產(chǎn)。不過按照日本總部的要求,我們的任何設(shè)計或技術(shù)圖紙改進(jìn)完成后,都需要發(fā)送到總部進(jìn)行資料初審,審核通過后再通過電話會議進(jìn)行技術(shù)評審。VDSL項目設(shè)計圖紙發(fā)到總部后很快收到一些改進(jìn)要求和建議。記憶最深的一項是,總部工程師覺得得我們的保險絲熔斷電流選擇過大,要求更改保險絲規(guī)格,比如系統(tǒng)最大允許的工作電流是10A,我們的保險絲選擇11A,而日方工程師建議選擇9A。我們都知道保險絲的電流不能低于最大工作電流,因此我們團隊成員包括我在內(nèi)都覺得很不理解,甚至覺得提建議的工程師水平太低。
因為ADSL產(chǎn)品在日本工廠的試生產(chǎn)過程中發(fā)現(xiàn)有些問題,公司安排我立即趕赴工廠分析原因,經(jīng)過現(xiàn)場分析測試后問題當(dāng)天得到解決,而我也有機會見到那個提出保險絲建議的工程師。
提建議的是一位老工程師,據(jù)說在住友電工已經(jīng)工作了幾十年。當(dāng)我說明來意后他帶我到旁邊的會議坐下后,又抱了好大一摞資料過來。他的英文水平在日本工程師中還算不錯,不過日式發(fā)音確實比較難懂,而且有點磕磕巴巴,而我對日語的了解不超過從《地道戰(zhàn)》等電影里鬼子軍官說的幾句話。好在大家都是工程師,技術(shù)資料有些是英文的,日文版本的很多漢字也能明白,再加上圖表等,交流不存在障礙。
他很有耐心,不停的給我講解各種資料,包括了保險絲供應(yīng)商提供的規(guī)格書,不同系列的保險絲的工藝、特性、溫度曲線等,可以看到很多資料關(guān)鍵點上都有標(biāo)注。幾乎整整一下午,從他那里我學(xué)習(xí)到大量的關(guān)于保險絲的知識及選取原則,技術(shù)溝通變成虛心討教,對他的不屑變成了由衷的敬佩和尊重。
他是這么解釋的:選取保險絲的目的是在系統(tǒng)工作狀態(tài)異常時及時斷開電源;保險絲因材料工藝不同種類各異,特性差異很大,我們選擇的那款保險絲屬于慢速響應(yīng)性的熱熔斷絲,而熱熔斷的本質(zhì)是流過保險絲的電流在期望的時間內(nèi)熱量的累積超過保險絲的熔斷要求,這是一個關(guān)于電流的積分過程,而且重要的是熔斷效應(yīng)是非線性的,需要先根據(jù)期望熔斷時間和規(guī)格書查找曲線圖上合適的點后反推到合適電流;他經(jīng)過仔細(xì)分析計算,我們這個項目最大電流持續(xù)時間極短,按照那個持續(xù)時間和最大電流的積分效應(yīng)根本不足以熔斷我們選擇的保險絲,換句話說我們選擇的保險絲根本達(dá)不到保險的目的;他是經(jīng)過分析、查表最終計算出比較合適的規(guī)格并據(jù)此提出建議;
雖然這位老工程師的面容早已忘記,姓名也壓根記不起,卻唯獨依舊記得那厚厚的資料,他詳細(xì)的分析,嚴(yán)謹(jǐn)?shù)耐茖?dǎo)計算,以及我當(dāng)時的震撼和羞愧。從此之后,我努力去理解接觸到的每一種元器件的基本原理,對別人設(shè)計中不理解的部分不敢妄加評議。
這些年,我接觸過很多硬件工程師,也面試過許多硬件工程師,很遺憾很少有硬件工程師深入理解各種器件的原理和特性,每每看到那種無知而不屑的笑容,我仿佛就看到自己當(dāng)年的影子。
2005年四月,我們研發(fā)的工業(yè)級ADSL局端和終端設(shè)備完成功能樣機貼片和硬件測試,開始和軟件團隊進(jìn)行系統(tǒng)聯(lián)調(diào)。順利開機、初始化完成、網(wǎng)絡(luò)連接正常,一起順利,大家紛紛開始憧憬起美妙的黃金周長假了。
不幸的消息很快從軟件部反饋過來,經(jīng)過初步測試,發(fā)現(xiàn)ASDL終端設(shè)備上行數(shù)據(jù)速率正常,但是下行數(shù)據(jù)速率遠(yuǎn)低于設(shè)計要求,和芯片規(guī)格書給出的指標(biāo)相差甚遠(yuǎn)。按照常規(guī)流程,硬件團隊馬上進(jìn)行電路測試,信號分析,供電檢查等;軟件團隊進(jìn)行驅(qū)動檢查,特別是寄存器配置和數(shù)據(jù)分析等。大家樂觀的認(rèn)為,解決這種問題應(yīng)該不算難事。
接下來幾天,大家做了大量的工作。首先就是對問題進(jìn)行定位,看看是因為硬件不良還是軟件驅(qū)動存在問題。硬件方面首先對電路板進(jìn)行完整的靜態(tài)和動態(tài)測試,驗證信號時序、邏輯、電平等,未發(fā)現(xiàn)明顯異常。接著擴大硬件測試樣品數(shù)量,確認(rèn)同一批次的板子測試結(jié)果和不良現(xiàn)象高度一致,基本排除了因物料差異和貼裝工藝導(dǎo)致的個體差異;軟件工程師將各種可能導(dǎo)致Bug的問題進(jìn)行模擬驗證,對不同版本的驅(qū)動進(jìn)行對比,對相關(guān)寄存器進(jìn)行逐一排查,也未發(fā)現(xiàn)任何有價值的線索。一番折騰下來,沒有什么進(jìn)展,而五一長假開始了,沒有什么好說的,取消一切出行計劃,開始加班加點解決問題。
各種常規(guī)的方法無法突破后,我們開始進(jìn)行各種交叉測試:將阿爾卡特和中興等幾家采用相同硬件方案的Flash芯片取下來,和我們板子上Flash芯片互換進(jìn)行交叉試驗,盡管采用的標(biāo)準(zhǔn)不一樣,但除了啟動時各家Logo不同外,其它功能基本沒問題。別的公司的板子更換Flash前后均正常,而我們的板子更換前后下行速率始終不能達(dá)到指標(biāo)要求。這基本確定了問題是出在硬件的設(shè)計上。
明確了問題范圍,我們開始對硬件進(jìn)行新一輪測試排查,測試的重點從時域轉(zhuǎn)換到頻域,果然通過頻譜分析儀測試分析,發(fā)現(xiàn)在600KHz附近有嚴(yán)重的干擾,而這一頻帶正是是下行通道的主力通帶范圍,0到4KHz是音頻通帶,是低通濾波后接電話機用于語音通信的,25KHz到200KHz是數(shù)據(jù)上行頻帶,200KHz到1.1MHz是數(shù)據(jù)下行通帶。
找到干擾頻點后就繼續(xù)追查干擾源,發(fā)現(xiàn)在距離通信驅(qū)動接口芯片比較遠(yuǎn)的的一顆DC-DC芯片的功率電感處存在2倍頻600KHZ的較強干擾,繼續(xù)分析發(fā)現(xiàn)該電源芯片的振蕩頻率為300KHz,而原來參考設(shè)計上的是同一家公司的非常接近的料號的一顆料,但原來的芯片振蕩頻率是600KHz,2倍頻后是1.2MHz,已經(jīng)超出了ADSL的1.1MHz的頻帶范圍,但這顆料即將停產(chǎn),所以后來電源供應(yīng)商的FAE和我們的工程師溝通時極力推薦這顆新料,由于新老物料參數(shù)一致而且價格更低,工程師就選擇了新料,由于料號幾乎相同,工程師在送樣測試時覺得輸出電壓、紋波系數(shù)和負(fù)載能力等指標(biāo)都和老料一致,因而就選擇了新料。
因為該芯片距離通信接口芯片較遠(yuǎn),干擾源不是通過線間串?dāng)_過來而是通過空間耦合過來的,在時域范圍內(nèi)極難發(fā)現(xiàn)分析。問題定位后,通過在功率電感上增加屏蔽罩徹底解決了這個問題。但是七天長假已經(jīng)過去了六天,而我也落下了腰肌勞損的毛病,直到幾年后采用朋友的偏方才慢慢痊愈。
細(xì)細(xì)反思,至少有幾方面的教訓(xùn):細(xì)節(jié)真的很重要,任何物料的跟更換都要慎之又慎,每個參數(shù)都要搞清楚;基礎(chǔ)知識真的很重要,如通信類的頻帶劃分,調(diào)制方式,時域和頻域的測試分析能力等;思路開闊、靈活應(yīng)變,需要多維度思考問題。
在成長實錄之教訓(xùn)系列之三中我有提到,2005年五一期間我們解決了ADSL局端及終端設(shè)備的頻帶干擾問題,初步測試下來功能正常,性能滿足要求,終于可以交付到測試部門進(jìn)行完整的測試。不出意料的,新問題來了。
測試工程師測試下來發(fā)現(xiàn)一個問題,設(shè)備正常工作一段時間后會莫名奇妙的自動重啟,從開機到重啟的時間每次不固定,而且手上的5臺樣機都存在同一問題。
接到測試報告后,軟硬件團隊開始聯(lián)手進(jìn)行系統(tǒng)調(diào)試。有系統(tǒng)開發(fā)經(jīng)驗的都知道,這個問題對工程師調(diào)試來說喜憂參半,喜的是這是一個必現(xiàn)的bug,相對來說問題比較容易復(fù)現(xiàn)和定位,問題是否得到解決比較好驗證;憂的是這個問題出現(xiàn)的時間長短是隨機的,功能都已實現(xiàn),性能也達(dá)到要求,這種情況下的問題往往不簡單,需要調(diào)試的工作量很大。
這個問題對于硬件部分比較常見的問題一般有電源設(shè)計不良、復(fù)位電路、晶振電路、過熱保護、元器件不良、生產(chǎn)制程不良等;軟件部分可能存在的問題有系統(tǒng)配置不正確、異常流程處理不當(dāng)、內(nèi)部看門狗不正確觸發(fā)等。
硬件團隊首先排查了可能存在制程問題,通過目視檢查和X-ray照射,未發(fā)現(xiàn)明顯異常;
全面監(jiān)測復(fù)位、供電和晶振等,均未發(fā)現(xiàn)自動重啟時存在異常狀態(tài),通過對電路板全面的熱監(jiān)測也未發(fā)現(xiàn)存在過熱區(qū)域;軟件團隊也對可能存在的問題逐一排除,未發(fā)現(xiàn)任何異常。調(diào)試陷入僵局,項目一時無法進(jìn)展。
沒辦法,軟硬件團隊再次回到對故障現(xiàn)象的分析梳理,重新擬定測試方案,尋找重啟時的共同點。經(jīng)常大量的測試,終于發(fā)現(xiàn)當(dāng)系統(tǒng)傳輸大容量數(shù)據(jù)時出現(xiàn)重啟概率要大很多,而那種很輕負(fù)載狀態(tài)的設(shè)備重啟幾率較小,時間間距也會拉開更大。找到規(guī)律不代表就能找到確切問題點,甚至更加讓人迷茫。
當(dāng)所有的分析測試都沒有結(jié)果時,我們重新回到對生產(chǎn)制程的分析,由于主控芯片和MAC芯片都是BGA封裝,電路板本身是10層板,大部分走線都是走在內(nèi)層,對我們的排查來說困難重重。經(jīng)過不懈努力,發(fā)現(xiàn)主控芯片到MAC的16根地址線因走線和貼裝工藝存在瑕疵而有虛短路現(xiàn)象,其中一根和地之間的阻抗由正常的10兆歐左右降為1兆歐左右,由于檢查BGA貼裝質(zhì)量的X-ray主要檢查是否存在短路或斷路問題,對于虛短是很難檢查出來的。由于該地址線并未短路,在初始化或低速率傳輸數(shù)據(jù)時問題不大,但當(dāng)大容量數(shù)據(jù)高速傳輸時,地址線之間的差異就會顯現(xiàn)出來,導(dǎo)致程序運行異常而觸發(fā)內(nèi)部看門狗,從現(xiàn)象上看就是系統(tǒng)自動重啟。
經(jīng)驗教訓(xùn):不是能夠正常工作了硬件就萬事大吉,還要關(guān)注壓力測試和長時間測試;阻抗匹配很重要,對于很多問題,數(shù)據(jù)線和地址線等對地阻抗測試會告訴我們很多信息;嵌入式系統(tǒng)的調(diào)試一定要有系統(tǒng)概念,軟硬件及測試團隊的通力協(xié)作是快速發(fā)現(xiàn)問題、定位問題和解決問題的前提和保證,很多現(xiàn)象是多種因素引起的,只有經(jīng)多細(xì)致分析,大膽推測、反復(fù)驗證才能解決問題。
原文標(biāo)題:電子工程師成長之教訓(xùn)系列故事(上)
文章出處:【微信公眾號:電子發(fā)燒友網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。
舉報投訴
原文標(biāo)題:電子工程師成長之教訓(xùn)系列故事(上)
文章出處:【微信號:elecfans,微信公眾號:電子發(fā)燒友網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
相關(guān)推薦
電子工程師在實際工作中積累了豐富的經(jīng)驗,這些經(jīng)驗對于新手工程師和電子專業(yè)的學(xué)生具有重要的參考價值。 一、電路設(shè)計經(jīng)驗 電路設(shè)計核心思想 電路設(shè)計的核心在于理解電路的基本原理和功能需求。
發(fā)表于 01-14 10:14
?58次閱讀
電子工程師
揚興科技
發(fā)布于 :2025年01月07日 18:41:12
硬件工程師
揚興科技
發(fā)布于 :2024年10月30日 18:39:16
硬件工程師
安泰小課堂
發(fā)布于 :2024年09月25日 18:47:52
電子工程師
安泰小課堂
發(fā)布于 :2024年07月25日 11:31:02
的基礎(chǔ) 嵌入式軟件工程師需要具備扎實的計算機科學(xué)和工程知識。因此,在職業(yè)生涯的起步階段,建議將重點放在學(xué)習(xí)基礎(chǔ)知識上,包括數(shù)據(jù)結(jié)構(gòu)、算法、操作系統(tǒng)、編程語言等。通過深入學(xué)習(xí)這些基礎(chǔ)知識,打下堅實的理論基礎(chǔ),為將來
發(fā)表于 06-12 11:20
電子工程師行業(yè)資訊
安泰小課堂
發(fā)布于 :2024年06月03日 17:58:52
硬件工程師
揚興科技
發(fā)布于 :2024年05月29日 18:23:29
技術(shù)。與之相比,嵌入式硬件工程師更注重硬件設(shè)計和電路原理,需要掌握電子工程學(xué)、數(shù)字電路、模擬電路等知識??偟膩碚f,嵌入式軟件工程師的技能需求更加偏重于軟件開發(fā),而嵌入式硬件
發(fā)表于 05-16 11:00
電子工程師
安泰小課堂
發(fā)布于 :2024年05月13日 17:29:54
電子工程師
揚興科技
發(fā)布于 :2024年05月04日 01:33:18
電子工程師電路
安泰小課堂
發(fā)布于 :2024年04月30日 17:33:15
即將走馬上任電源工程師這個崗位,請問各位大佬,這個崗位的職業(yè)路徑一般是怎樣的?
發(fā)表于 04-08 14:19
電子工程師硬件
電子發(fā)燒友網(wǎng)官方
發(fā)布于 :2024年02月28日 17:50:00
電子工程師示波器
安泰小課堂
發(fā)布于 :2024年02月22日 17:39:38
評論