本人從研究生開始學(xué)習(xí)語(yǔ)音頻信號(hào)處理到工作中實(shí)際的工程實(shí)踐 , 至今已經(jīng)七年多了 , 這跟 ” 七年之癢 ” 真的沒(méi)有關(guān)系 , 主要是一方面最近比較空閑 , 有時(shí)間做些總結(jié)和規(guī)劃 , 另一方面也是為準(zhǔn)備從事這個(gè)職業(yè)或者正在從事這個(gè)職業(yè)的新手們提供一點(diǎn)參考 , 當(dāng)然一家之言 , 歡迎大家交流討論 , 尤其希望那些資深人士不吝指點(diǎn) 。
1 、涉及的方向
1 )語(yǔ)音、音頻編解碼算法
已經(jīng)成熟地商業(yè)化、產(chǎn)品化,壓縮碼率和音質(zhì)總是一對(duì)冤家,只有一些特殊的存儲(chǔ)和通信應(yīng)用會(huì)要求低碼率,更多的是追求高品質(zhì)的音質(zhì),例如高清音質(zhì)。
2 )語(yǔ)音識(shí)別算法
做過(guò)一年半,初步了解識(shí)別率受多種因素影響,技術(shù)本身還需要在抗干擾等方面進(jìn)一步發(fā)展,目前只有一些特殊場(chǎng)合的應(yīng)用產(chǎn)品化,作為人機(jī)交互的大規(guī)模應(yīng)用還有一段路要走。
3 )語(yǔ)音合成算法
這個(gè)沒(méi)有接觸核心技術(shù),不妄加評(píng)論,反正據(jù)說(shuō)科大訊飛在這個(gè)方向非常強(qiáng)。
4 )語(yǔ)音增強(qiáng)算法
這個(gè)沒(méi)有接觸核心技術(shù),感覺(jué)回聲消除、降噪處理等還是很有用處。
5 )語(yǔ)音信號(hào)分析
主要一些特殊應(yīng)用需求,如智能玩具、軍工等。
6 )音頻特征提取和檢索
音樂(lè)哼唱和音樂(lè)檢索,以及音頻的特殊應(yīng)用。
7 )音效處理算法
在 MP3 上非常普遍的音效處理算法,當(dāng)然也有立體聲環(huán)繞和多聲道處理算法。
2 、涉及的行業(yè)
這個(gè)行業(yè)需要這個(gè)職業(yè)的一般,尤其是做多媒體芯片的,往往需要為芯片提供高品質(zhì)的音視頻算法 。 在低功耗、資源少的情況下保證音視頻的最佳化應(yīng)用。
2 )計(jì)算機(jī)軟硬件
這個(gè)行業(yè)里,可以做標(biāo)準(zhǔn)算法的研發(fā),也可以做應(yīng)用程序,或者是第三方軟件開發(fā)。
3 )通信行業(yè)
這個(gè)行業(yè)應(yīng)該不多,一般音頻編解碼屬于信源編碼,而通信行業(yè)涉及的技術(shù)比較多,從天線的發(fā)送接收,基帶芯片的解碼,語(yǔ)音編解碼,上下信道的控制等系統(tǒng)。
3 、涉及的職業(yè)
1 )做標(biāo)準(zhǔn)、第三方算法研發(fā)
做音頻算法的國(guó)際標(biāo)準(zhǔn),如 ITU G.7xx 、寬帶語(yǔ)音編碼,或者第三方語(yǔ)音算法的研發(fā),如語(yǔ)音識(shí)別、語(yǔ)音合成等。往往這樣的職位需要碩士以上學(xué)歷,對(duì)數(shù)字信號(hào)處理理論要求較高。
2 )做移植、優(yōu)化
在芯片公司為產(chǎn)品做音頻算法的移植和優(yōu)化,需要對(duì)芯片指令和算法本身有較強(qiáng)的理解。做嵌入式產(chǎn)品,就意味著在低成本、低功耗、資源少的情況下要具有足夠的耐心去一點(diǎn)點(diǎn)優(yōu)化算法,我曾經(jīng)對(duì) AMR-NB 中的碼書搜索部分、 LSF 矢量量化部分進(jìn)行至少 5 遍的代碼優(yōu)化,漸漸將所用的指令數(shù)減到最小化。每一遍過(guò)后都覺(jué)得沒(méi)有再優(yōu)化的地方了,然后靜下心再分析算法原理、分析代碼執(zhí)行和指令特點(diǎn),就有了新的發(fā)現(xiàn)。以至于后來(lái)流傳著“優(yōu)化無(wú)極限”,當(dāng)然優(yōu)化工作很可能是用較少的時(shí)間就優(yōu)化了總量的 80% ,但剩下的 20% 需要付出更多的時(shí)間,全憑項(xiàng)目的需求來(lái)權(quán)衡了,積累一定的經(jīng)驗(yàn)很重要。
3 )做產(chǎn)品應(yīng)用
做一般多媒體軟件的應(yīng)用開發(fā),涉及語(yǔ)音頻本身的理論較少,更多的是計(jì)算機(jī)技術(shù)。
4 、優(yōu)缺點(diǎn)
做語(yǔ)音頻算法職業(yè)的缺點(diǎn)是 ” 少 ”, 相關(guān)的公司少,專業(yè)對(duì)口的職業(yè)少,做這個(gè)職業(yè)的人也少 , 發(fā)展機(jī)會(huì)少一點(diǎn),當(dāng)然這個(gè)“少”也是不同時(shí)期,不同職業(yè)之間的相對(duì)比較而言的。優(yōu)點(diǎn)自然是競(jìng)爭(zhēng)壓力相對(duì)小些,工作相對(duì)穩(wěn)定。
5 、三點(diǎn)總結(jié)
我一路走來(lái),犯了許多錯(cuò)誤,但是塞翁失馬,焉知非福?
1) 雜而不專
“?!笔侵笇W⒃谝粋€(gè)方向上的技術(shù)和業(yè)務(wù)積累。
我剛開始的時(shí)候,一段時(shí)間看看語(yǔ)音頻編解碼,一段時(shí)間看看靜態(tài)圖像處理技術(shù),一邊研究計(jì)算機(jī)網(wǎng)絡(luò)技術(shù),一邊了解一下視頻壓縮算法,今天搞搞寫寫 Window 程序,明天去焊焊電路。典型的學(xué)的雜,但是哪個(gè)都淺嘗輒止,最后想想哪個(gè)都拿不出手,感覺(jué)就是樣樣行,樣樣都很膚淺。
2) 專而不精
“精”是指在一個(gè)方向上達(dá)到精通的水平(技術(shù)方面)和高效的業(yè)務(wù)能力(項(xiàng)目管理方面)。
工作了一段時(shí)間,比較清楚自己的興趣和特長(zhǎng),于是靜下心盡量把范圍縮小,主要集中在語(yǔ)音頻編解碼上,但是有時(shí)還要根據(jù)實(shí)際項(xiàng)目需求去做其它方向的。另外,如果項(xiàng)目時(shí)程緊張的話,技術(shù)方面如果不經(jīng)過(guò)深加工,積累的經(jīng)驗(yàn)還是很少。我目前正處于這個(gè)階段,需要堅(jiān)實(shí)的理論基礎(chǔ)以便深入算法(算法層面)和不斷的總結(jié)項(xiàng)目經(jīng)驗(yàn)教訓(xùn)(工程實(shí)現(xiàn)方面)來(lái)提高自己。
3) 精而不廣
“廣”是指見識(shí)要廣,具有行業(yè)思維、市場(chǎng)化的眼光。
身處在這個(gè)賴以謀生的行業(yè),自然要關(guān)心一下它的動(dòng)態(tài)發(fā)展,我們?cè)诩夹g(shù)上要深挖一口井,但眼界上卻不要做一個(gè)井底之蛙!
最后,談一下工作態(tài)度,我自認(rèn)為資質(zhì)平庸,還是踏踏實(shí)實(shí)做事,認(rèn)認(rèn)真真做人。不要盲目和別人攀比,產(chǎn)生不良的心態(tài),影響日常的工作和生活。對(duì)于那些比我強(qiáng)的人,我是這樣看的:客觀上,他們一定有我們不具有的能力,這里的能力是指綜合評(píng)價(jià)得到的,包括智商(學(xué)習(xí)能力、技術(shù)深度廣度、創(chuàng)新思維等)、情商(人脈關(guān)系、成長(zhǎng)環(huán)境、習(xí)慣等);主觀上,每個(gè)人都有自己的人生軌跡,苦辣酸甜只有自己知道,平衡好自己生活的各個(gè)方面才是最好的。
-
算法工程師
+關(guān)注
關(guān)注
2文章
30瀏覽量
6133
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論