資料介紹
摘 要
本論文詳細(xì)介紹了一款低成本便攜式的OCR文字識(shí)別 ,TTS語(yǔ)音播報(bào)系統(tǒng)的實(shí)現(xiàn)方案。本次研發(fā)的盲人導(dǎo)讀儀系統(tǒng),核心的軟硬模塊子子系統(tǒng)包括:500萬(wàn)高清攝像頭JPEG圖像采集子系統(tǒng),大功率NRF2401圖像傳輸子系統(tǒng),MFC上位機(jī)圖像解碼子系統(tǒng),OCR模式識(shí)別子系統(tǒng), TTS文本語(yǔ)音子系統(tǒng)。本文將對(duì)設(shè)計(jì)的各個(gè)子系統(tǒng)詳細(xì)闡述。
關(guān)鍵詞:模式識(shí)別OCR; TTS語(yǔ)音播報(bào)系統(tǒng); OV5640五百萬(wàn)像素采集系統(tǒng);
OCR blind reading meter based on template matching
This paper introduces in detail a low-cost portable OCR character recognition, the implementation scheme of TTS speech broadcasting system. The research and development of the blind reading meter system, the core of hard and soft module a subsystem including: 5 million hd camera JPEG image acquisition subsystem, high-power NRF2401 image transmission subsystem, MFC PC image decoding subsystem, OCR pattern recognition subsystem, TTS text-to-speech subsystem. This article will be to the design of each subsystem in detail
Key words: OCR pattern recognition; TTS speech broadcasting system; OV5640 mega pixels acquisition system。
1緒論
書(shū)籍是人類(lèi)進(jìn)步的階梯,視覺(jué)障礙的弱勢(shì)群體如果想要閱讀一些文獻(xiàn)資料,傳統(tǒng)的方法要依賴(lài)盲文,憑借手觸覺(jué)去感知文字,由于盲文的發(fā)行量相對(duì)較少,加上他笨重,體積大,致使收到很大限制。隨著計(jì)算機(jī)的領(lǐng)域的飛速發(fā)展,OCR (Optical Character Recognition,光學(xué)字符識(shí)別) ,TTS(Text To Speech,從文本到語(yǔ)音),OV5640(高清攝像頭)日益成熟,這些新興技術(shù),將為視覺(jué)殘障人士帶來(lái)福音,將視覺(jué)文字變成聽(tīng)覺(jué)語(yǔ)音,自此弱勢(shì)的殘障人士可以打破視覺(jué)閱讀障礙,享受文本書(shū)籍的知識(shí)殿堂。
1.1課題的背景與意義
我國(guó)的印刷體漢字識(shí)別是從70年代開(kāi)始研究,大致可以分為如下3個(gè)階段:
第一階段:20世紀(jì)70年代末期到20時(shí)期,主要是算法和方案探索。
第二階段:20世紀(jì)90年代,中文OCR技術(shù)從實(shí)驗(yàn)室走向市場(chǎng)。
第三階段:21世紀(jì)初至今,主要是印刷體漢字識(shí)別技術(shù)和系統(tǒng)性能的提高,包括漢英混排識(shí)別率的提高和穩(wěn)健性的增強(qiáng)。
1.2 OCR的研究現(xiàn)狀及研究意義
現(xiàn)有的文字技術(shù)一般采用光學(xué)的方式將文本圖像信息采集到計(jì)算機(jī)中,因此該技術(shù)被稱(chēng)為光學(xué)字符識(shí)別(Optical Character Recognition, OCR)技術(shù),經(jīng)過(guò)將近一個(gè)研究,OCR已經(jīng)成為現(xiàn)如今模式是被領(lǐng)域里最活躍的研究方向之一。它綜合了人工智能,計(jì)算機(jī)圖像,數(shù)字圖像處理等多方面的內(nèi)容,并在計(jì)算機(jī)領(lǐng)域及其相關(guān)領(lǐng)域得到了廣泛的應(yīng)用。近些年來(lái),我國(guó)的中文印刷體文檔識(shí)別發(fā)展十分
隨著社會(huì)的發(fā)展,科學(xué)文化的進(jìn)步,越來(lái)越多的視覺(jué)障礙人式(包括先天性行殘疾人士,或者因意外事故及其傷病視力下降乃至失去視覺(jué)的殘疾人士)更加渴望閱讀這個(gè)時(shí)代最前沿的書(shū)籍期刊,鑒于盲文的厚重,不便于攜帶,印刷量小,延遲性高等缺點(diǎn),市場(chǎng)上主流的OCR識(shí)別器售價(jià)相對(duì)較高,一種低成本,高識(shí)別率的OCR盲人導(dǎo)讀儀的研發(fā)有相當(dāng)大的現(xiàn)實(shí)意義,其核心算法也有著極其廣泛的社會(huì)應(yīng)用:
1.使用OCR進(jìn)行印刷體版文稿的自動(dòng)識(shí)別錄入,這類(lèi)產(chǎn)品的缺點(diǎn)是對(duì)于表格,插圖,公式需要手工進(jìn)行干預(yù)。
2圖形,圖像,公式,文本,中英文交疊等混版復(fù)雜版面進(jìn)行自動(dòng)切分的印刷識(shí)別系統(tǒng)的算法研究提供解決思路。
3郵件自動(dòng)分揀系統(tǒng),郵件的自動(dòng)分揀系統(tǒng)東是郵政系統(tǒng)提高心寒分揀速度和質(zhì)量的極為有效手段之一國(guó)內(nèi)外已經(jīng)普遍使用,其核心算法是書(shū)寫(xiě)體的識(shí)別。
4 手寫(xiě)體表格數(shù)據(jù)自動(dòng)錄入系統(tǒng),應(yīng)用于政府,保險(xiǎn),醫(yī)療等個(gè)行業(yè)的申報(bào)表,調(diào)查表等表格數(shù)據(jù)的處理與錄入【1】。 。
1.3研究的主要內(nèi)容和預(yù)期目標(biāo)
該系統(tǒng)致力于實(shí)現(xiàn)一種低成本,便攜式,易操作,高識(shí)別率的簡(jiǎn)易OCR中文識(shí)別系統(tǒng)。根據(jù)基于模板匹配的OCR的自身特點(diǎn),以及現(xiàn)階段研究水平,調(diào)研了中文OCR在各個(gè)行業(yè)的應(yīng)用市場(chǎng),如下對(duì)基于模板匹配的盲人導(dǎo)讀儀的各個(gè)系統(tǒng)和實(shí)現(xiàn)原理及算法進(jìn)行簡(jiǎn)要講解。
1.3.1 核心子系統(tǒng)解決方案概述
1. 基于OV5640 500萬(wàn)像素的自動(dòng)對(duì)焦的高清攝像頭模組,實(shí)現(xiàn)JPEG,BMP高清圖像采集存儲(chǔ)。
2. 基于大功率NRF2401的無(wú)線傳圖子系統(tǒng),可以實(shí)現(xiàn)一點(diǎn)對(duì)多點(diǎn),單點(diǎn)對(duì)單點(diǎn)實(shí)時(shí)圖像采集傳輸。
3基于VS2010 MFC上位機(jī)算法處理子系統(tǒng),SerialPort串口接收模塊,Cimage類(lèi)進(jìn)行數(shù)據(jù)流圖像解碼編碼,微軟公司開(kāi)源MicroSoft Image documentOCR控件作為核心算法將采集解碼得到圖片文字解碼出來(lái),顯示到Edit文本框,將文字編碼串口發(fā)送科科大訊飛模塊。
4基于科大訊飛模組XFS5512CE文字語(yǔ)音轉(zhuǎn)碼解碼芯片將OCR識(shí)別的文字進(jìn)行語(yǔ)音播報(bào),實(shí)現(xiàn)文本到語(yǔ)音的轉(zhuǎn)換。
1.3.2 預(yù)期目標(biāo)
1. STM32F103RBT6能正常驅(qū)動(dòng)500萬(wàn)OV5640高清模組,實(shí)現(xiàn)圖形采集
2. NRF2401能實(shí)現(xiàn)無(wú)線傳圖,文字解碼信息發(fā)送
3.MFC數(shù)據(jù)流解碼JPEG,OCR文字識(shí)別,OCR解碼發(fā)送
4.下位機(jī)驅(qū)動(dòng)科大訊飛模塊,實(shí)現(xiàn)文字解碼發(fā)送。
2基于模板匹配中文OCR語(yǔ)音導(dǎo)讀儀工作原理
2.1 OCR工作原理
與普通印刷體文檔是被相比,中文印刷體文檔識(shí)別在對(duì)文檔所包含的文字字符識(shí)別過(guò)程中。一個(gè)完整的中文印刷體文檔識(shí)別系統(tǒng)應(yīng)包括如下諸多模塊:
文檔圖像預(yù)處理。該部分完成對(duì)原始文檔圖像預(yù)處理,使得原始文檔圖像能夠達(dá)到識(shí)別的要求。
文檔圖像版面分析,該部分實(shí)現(xiàn)文檔圖像中文本,表格和圖像等不同區(qū)域的分離,并在識(shí)別出每個(gè)區(qū)域的類(lèi)別后交由不同的處理模塊進(jìn)行進(jìn)一步的分析和處理。
文檔圖像中的多字符識(shí)別,該部分處理通過(guò)文檔版面分析得到的文本區(qū)域,包括漢字識(shí)別和公式識(shí)別的模塊。漢字識(shí)別模塊負(fù)責(zé)包括中文字符在內(nèi)的所有字符的識(shí)別。
文檔圖像中圖形圖像暫存模塊。該部分負(fù)責(zé)處理通過(guò)文檔版面分析得帶的圖像圖像區(qū)域。
版面分析過(guò)程中,分析得到的文字區(qū)域,圖像區(qū)域和表格區(qū)域?qū)⒈环謩e切割成單獨(dú)的圖像,其中文字圖像區(qū)域?qū)⑺椭劣∷Ⅲw漢字識(shí)別模塊進(jìn)行處理。與其他的數(shù)字圖像模式識(shí)別應(yīng)用類(lèi)似,印刷體的漢字識(shí)別的基本過(guò)程包括圖像預(yù)處理。圖像分割,圖像分割,特征提取,圖像分類(lèi)等過(guò)程。圖像的預(yù)處理通過(guò)圖像增強(qiáng),文字字符切割等步驟形成單個(gè)漢字字符圖像,圖像分割則在單個(gè)漢字圖像中提起漢字輪廓,特征提取則是是依據(jù)漢字輪廓提取代表的各個(gè)漢字模式的本質(zhì)的表達(dá)形式,即各種特性,形成漢字模板庫(kù)(可以理解為字典)并存儲(chǔ)在計(jì)算機(jī)中。識(shí)別時(shí),圖像分類(lèi)過(guò)程將漢字的模式特性和漢字的模板庫(kù)元素逐一匹配,在用一定的匹配準(zhǔn)則進(jìn)行判別。最后在模板庫(kù)中找出最接近的位置漢字的模板元素,該模版元素的漢字就是識(shí)別的結(jié)果。
- OV5640資料包分享 41次下載
- ATK OV5640 AF V1.1圖下載 8次下載
- STM32驅(qū)動(dòng)攝像頭ov5640的驅(qū)動(dòng)源碼 7次下載
- 自動(dòng)對(duì)焦攝像頭模塊OV5640原理圖 46次下載
- CMOS圖像傳感器OV5640用戶(hù)手冊(cè).pdf 52次下載
- 基于stm32控制OV7670攝像頭 133次下載
- 基于D3 CAMERA MEZZ OV5640圖像傳感器的參考設(shè)計(jì)
- 機(jī)器視覺(jué)中基于灰度統(tǒng)計(jì)的快速模板匹配算法詳細(xì)概述 7次下載
- Leopard Imaging 10232017 LI-OV5640攝像頭圖解資料下載 31次下載
- OV5640_datasheet 86次下載
- 模板匹配 5次下載
- STM32工程模板 55次下載
- 基于模板匹配的圖像跟蹤技術(shù) 0次下載
- 基于模板匹配的電子元器件針腳檢測(cè)方法
- 基于改進(jìn)模板匹配的芯片缺陷檢測(cè)方法
- OpenCV邊緣模板匹配算法原理詳解 1076次閱讀
- OCR實(shí)戰(zhàn)教程 859次閱讀
- OpenMV如何實(shí)現(xiàn)旋轉(zhuǎn)模板匹配呢 1703次閱讀
- 3D模板匹配算法概述 1446次閱讀
- 如何通過(guò)OV5640攝像頭顯示在VGA顯示屏上 2989次閱讀
- 函數(shù)模板與類(lèi)模板的基本概念及實(shí)現(xiàn)原理 1610次閱讀
- 基于HALCON的形狀匹配算法的研究和心得總結(jié) 4200次閱讀
- 微雪電子OV5640 攝像頭模塊B型簡(jiǎn)介 3746次閱讀
- 微雪電子OV5640攝像頭模塊A型簡(jiǎn)介 5878次閱讀
- 微雪電子OV5640 攝像頭模塊C型簡(jiǎn)介 2915次閱讀
- 飛凌嵌入式500W攝像頭介紹 2303次閱讀
- 天嵌科技OV5640攝像頭模塊-CMOS攝像頭介紹 1.2w次閱讀
- 基于OmniVision的OV5640設(shè)計(jì)的USB攝像頭模塊 5661次閱讀
- ov7620怎么接線_ov7620硬件連接 8818次閱讀
- 一文看懂ov7620與ov7670的區(qū)別 5.1w次閱讀
下載排行
本周
- 1TC358743XBG評(píng)估板參考手冊(cè)
- 1.36 MB | 330次下載 | 免費(fèi)
- 2開(kāi)關(guān)電源基礎(chǔ)知識(shí)
- 5.73 MB | 6次下載 | 免費(fèi)
- 3100W短波放大電路圖
- 0.05 MB | 4次下載 | 3 積分
- 4嵌入式linux-聊天程序設(shè)計(jì)
- 0.60 MB | 3次下載 | 免費(fèi)
- 5基于FPGA的光纖通信系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
- 0.61 MB | 2次下載 | 免費(fèi)
- 651單片機(jī)窗簾控制器仿真程序
- 1.93 MB | 2次下載 | 免費(fèi)
- 751單片機(jī)大棚環(huán)境控制器仿真程序
- 1.10 MB | 2次下載 | 免費(fèi)
- 8基于51單片機(jī)的RGB調(diào)色燈程序仿真
- 0.86 MB | 2次下載 | 免費(fèi)
本月
- 1OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234315次下載 | 免費(fèi)
- 2555集成電路應(yīng)用800例(新編版)
- 0.00 MB | 33564次下載 | 免費(fèi)
- 3接口電路圖大全
- 未知 | 30323次下載 | 免費(fèi)
- 4開(kāi)關(guān)電源設(shè)計(jì)實(shí)例指南
- 未知 | 21549次下載 | 免費(fèi)
- 5電氣工程師手冊(cè)免費(fèi)下載(新編第二版pdf電子書(shū))
- 0.00 MB | 15349次下載 | 免費(fèi)
- 6數(shù)字電路基礎(chǔ)pdf(下載)
- 未知 | 13750次下載 | 免費(fèi)
- 7電子制作實(shí)例集錦 下載
- 未知 | 8113次下載 | 免費(fèi)
- 8《LED驅(qū)動(dòng)電路設(shè)計(jì)》 溫德?tīng)栔?/a>
- 0.00 MB | 6653次下載 | 免費(fèi)
總榜
- 1matlab軟件下載入口
- 未知 | 935054次下載 | 免費(fèi)
- 2protel99se軟件下載(可英文版轉(zhuǎn)中文版)
- 78.1 MB | 537796次下載 | 免費(fèi)
- 3MATLAB 7.1 下載 (含軟件介紹)
- 未知 | 420026次下載 | 免費(fèi)
- 4OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234315次下載 | 免費(fèi)
- 5Altium DXP2002下載入口
- 未知 | 233046次下載 | 免費(fèi)
- 6電路仿真軟件multisim 10.0免費(fèi)下載
- 340992 | 191185次下載 | 免費(fèi)
- 7十天學(xué)會(huì)AVR單片機(jī)與C語(yǔ)言視頻教程 下載
- 158M | 183279次下載 | 免費(fèi)
- 8proe5.0野火版下載(中文版免費(fèi)下載)
- 未知 | 138040次下載 | 免費(fèi)
評(píng)論
查看更多