0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Tesseract的安裝測(cè)試使用

嵌入式DSP ? 來(lái)源:DSP工程師 ? 2019-11-20 15:44 ? 次閱讀

OCR開(kāi)源項(xiàng)目很多,給大家一個(gè)鏈接,這個(gè)鏈接列出了現(xiàn)有的比較出名的OCR開(kāi)源項(xiàng)目,鏈接如下:

https://en.wikipedia.org/wiki/Comparison_of_optical_character_recognition_software

從上面的排名可以看到,Tesseract是排在第一名的!所以下面就認(rèn)真學(xué)習(xí)一下Tesseract。首先介紹一下Tesseract,然后安裝,測(cè)試,了解其不足等等。

Tesseract的OCR引擎目前已作為開(kāi)源項(xiàng)目發(fā)布在Google Project,

其項(xiàng)目主頁(yè)在這里查看https://github.com/tesseract-ocr,

它支持中文OCR,并提供了一個(gè)命令行工具。python中對(duì)應(yīng)的包是

pytesseract. 通過(guò)這個(gè)工具我們可以識(shí)別圖片上的文字。

一 Tesseract的安裝測(cè)試使用

首先下載Tesseract在Windows下的安裝版。(因?yàn)樵趪?guó)外訪問(wèn)不了谷歌,所以別人***下載了下來(lái),這里給大家百度網(wǎng)盤鏈接)

http://pan.baidu.com/s/1i56Uxlr

根據(jù)https://github.com/tesseract-ocr/tesseract/wiki,找到非官方的安裝包,好像只看到64位的安裝包http://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-setup-4.00.00dev.exe,下載后直接安裝即可,但是要記得你的安裝目錄,我們等會(huì)配置環(huán)境變量要用。

如果不是做英文的圖文識(shí)別,還需要下載其他語(yǔ)言的識(shí)別包https://github.com/tesseract-ocr/tesseract/wiki/Data-Files。

簡(jiǎn)體字識(shí)別包:https://raw.githubusercontent.com/tesseract-ocr/tessdata/4.00/chi_sim.traineddata

繁體字識(shí)別包:https://github.com/tesseract-ocr/tessdata/raw/4.0/chi_tra.traineddata

1.3 安裝Tesseract

下載Tesseract-OCR引擎,注意要3.0以上才支持中文哦,按照提示安裝就行。(此處附上windows 4.0的安裝過(guò)程)

既然是要訓(xùn)練中文,記得勾選 additional language data

找到中文簡(jiǎn)體和中文繁體,按需勾選,然后點(diǎn)下一步

可以先不勾選,因?yàn)檫@樣直接下載語(yǔ)言的包實(shí)在太慢。可以從網(wǎng)頁(yè)上直接下載語(yǔ)言包,然后等程序安裝好后,放入安裝目錄下tessdata目錄下面

下載下來(lái)之后一路Next安裝好,然后在開(kāi)始菜單找到其控制臺(tái)引導(dǎo)程序,如下圖所示

1.4 測(cè)試英文字符識(shí)別

上面的安裝包里自帶了已經(jīng)訓(xùn)練好的英文-拉丁文識(shí)別數(shù)據(jù)~所以我們先來(lái)測(cè)試一下英文字符的識(shí)別吧~識(shí)別圖像如下:

1.4.1把上面的圖片放到Tesseract的安裝目錄下,如下圖所示:

1.4.2打開(kāi)上面提到的控制臺(tái)窗口,如下圖所示:

1.4.3在窗口中輸入命令:“tesseract.exe 0.jpg 1”,并回車,如下圖所示:

01.jpg代表待識(shí)別的源文件,1代表輸出文件名,默認(rèn)輸出格式是txt文件格式!

注意,上面的 lang之前是-l 而不是-1!

1.4.4讓我們先查看一下01.jpg照片,如下圖:

1.4.5在安裝目錄下生成了1.txt文件,識(shí)別結(jié)果如下圖所示:

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4618

    瀏覽量

    93038
  • OCR
    OCR
    +關(guān)注

    關(guān)注

    0

    文章

    145

    瀏覽量

    16386

原文標(biāo)題:深入學(xué)習(xí)使用ocr算法識(shí)別圖片中文字的方法

文章出處:【微信號(hào):ddongcloud,微信公眾號(hào):嵌入式DSP】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    如何使用 cURL 測(cè)試 HTTP 協(xié)議

    。以下是如何使用cURL測(cè)試HTTP協(xié)議的詳細(xì)步驟和示例。 1. 安裝cURL 在大多數(shù)Linux發(fā)行版和MacOS中,cURL已經(jīng)預(yù)裝。如果你使用的是Windows,可以從cURL的官方網(wǎng)站下載并
    的頭像 發(fā)表于 12-30 09:26 ?172次閱讀

    壓接式N頭連接器安裝方便嗎

    包括剝線、清潔、定位、插入、壓接和測(cè)試等幾個(gè)環(huán)節(jié)。這些步驟相較于傳統(tǒng)的焊接連接方式,省略了復(fù)雜的焊接工藝和專業(yè)的焊接設(shè)備需求,從而大大降低了安裝的復(fù)雜度和時(shí)間成本
    的頭像 發(fā)表于 11-19 09:44 ?180次閱讀
    壓接式N頭連接器<b class='flag-5'>安裝</b>方便嗎

    言必信科技 如何正確安裝磁環(huán)

    安裝磁環(huán)需了解特性、備齊工具材料,遵循預(yù)處理、選擇放置、固定、檢查測(cè)試步驟,注意數(shù)量分布、方向性、環(huán)境適應(yīng)性和安全操作,定期維護(hù)優(yōu)化,確保電子設(shè)備穩(wěn)定運(yùn)行。
    的頭像 發(fā)表于 11-13 15:12 ?374次閱讀
    言必信科技 如何正確<b class='flag-5'>安裝</b>磁環(huán)

    RSU&amp;OBU自動(dòng)化測(cè)試系統(tǒng)

    路側(cè)單元RSU與車載單元OBU是智能交通系統(tǒng)中的重要組成部分。RSU是ETC系統(tǒng)中安裝在路側(cè)的設(shè)備,它采用短程通信技術(shù)與車載單元OBU進(jìn)行通訊;OBU為安裝在車輛內(nèi)的小型設(shè)備,他記錄有車輛的基礎(chǔ)信息
    的頭像 發(fā)表于 10-30 15:39 ?226次閱讀
    RSU&amp;OBU自動(dòng)化<b class='flag-5'>測(cè)試</b>系統(tǒng)

    Docker運(yùn)行環(huán)境安裝

    、發(fā)布、測(cè)試和部署,可以幫助開(kāi)發(fā)人員將最新版本代碼應(yīng)用到生產(chǎn)環(huán)境中。 Docker可以安裝在多個(gè)平臺(tái)中,包括Mac、Windows和Linux。不過(guò),生產(chǎn)環(huán)境還是推薦在Linux上運(yùn)行,以下以主流的Linux操作系統(tǒng)(CentOS和ubuntu)為例,說(shuō)明Docker運(yùn)行
    的頭像 發(fā)表于 10-29 11:28 ?234次閱讀

    HarmonyOS高效測(cè)試必備HDC命令

    針對(duì)測(cè)試人員的需求,HDC 提供了豐富的命令集,幫助他們進(jìn)行設(shè)備連接、日志采集、應(yīng)用安裝與卸載、性能監(jiān)控等。以下是一些常用且對(duì)測(cè)試人員非常有幫助的 HDC 命令。
    的頭像 發(fā)表于 10-21 11:42 ?526次閱讀

    全新Fluke 1670 系列多功能安裝測(cè)試儀——測(cè)試速度提高30%,報(bào)告時(shí)間減少50%

    2024 年 10 月16 日 , 測(cè)試和測(cè)量?jī)x器的全球領(lǐng)導(dǎo)者——福祿克公司推出了 Fluke 1670 系列多功能安裝測(cè)試儀,旨在為電氣設(shè)備提供從安裝、調(diào)試到驗(yàn)收的全方位解決方案。
    的頭像 發(fā)表于 10-21 08:17 ?212次閱讀
    全新Fluke 1670 系列多功能<b class='flag-5'>安裝</b><b class='flag-5'>測(cè)試</b>儀——<b class='flag-5'>測(cè)試</b>速度提高30%,報(bào)告時(shí)間減少50%

    什么是系統(tǒng)集成測(cè)試?DC-DC電源測(cè)試系統(tǒng)可以測(cè)試哪些參數(shù)?

    對(duì)于DC-DC電源模塊的檢測(cè),自動(dòng)化集成測(cè)試系統(tǒng)以其軟硬件結(jié)合的特點(diǎn)成為首選,通過(guò)軟件程控實(shí)現(xiàn)測(cè)試自動(dòng)化。該系統(tǒng)一般采用自動(dòng)化測(cè)試柜的設(shè)計(jì),便于搬運(yùn)和安裝,同時(shí)節(jié)省了空間。面對(duì)電源模塊
    的頭像 發(fā)表于 09-11 18:07 ?375次閱讀
    什么是系統(tǒng)集成<b class='flag-5'>測(cè)試</b>?DC-DC電源<b class='flag-5'>測(cè)試</b>系統(tǒng)可以<b class='flag-5'>測(cè)試</b>哪些參數(shù)?

    電源ATE自動(dòng)測(cè)試系統(tǒng)的定制化測(cè)試

    納米軟件電源模塊測(cè)試系統(tǒng)采用模塊化內(nèi)嵌式框架結(jié)構(gòu),將測(cè)試設(shè)備與測(cè)試PC集成在電源測(cè)試柜中。該測(cè)試柜是標(biāo)準(zhǔn)36U自動(dòng)化
    的頭像 發(fā)表于 08-26 15:55 ?439次閱讀
    電源ATE自動(dòng)<b class='flag-5'>測(cè)試</b>系統(tǒng)的定制化<b class='flag-5'>測(cè)試</b>柜

    家用斷路器的安裝方法

    家用斷路器的安裝是家庭電氣安全的重要環(huán)節(jié),其安裝方法需要細(xì)致且準(zhǔn)確,以確保電路的安全可靠運(yùn)行。以下是對(duì)家用斷路器安裝方法的詳細(xì)介紹,包括安裝前的準(zhǔn)備、
    的頭像 發(fā)表于 08-23 11:36 ?1138次閱讀

    德國(guó)GMC-I多功能安裝測(cè)試儀METRALINE MF - 高效、便捷的電氣測(cè)試解決方案

    安裝測(cè)試儀,用于符合 IEC 60364-6 (DIN VDE 0100-600)、DIN EN 50110-1 (DIN VDE 0105-100)、IEC 61851-1 (DIN VDE 0122-1) 和 EN 61557 (VDE 0413) 相應(yīng)部分的電氣系統(tǒng)
    的頭像 發(fā)表于 05-28 16:18 ?261次閱讀
    德國(guó)GMC-I多功能<b class='flag-5'>安裝</b><b class='flag-5'>測(cè)試</b>儀METRALINE MF - 高效、便捷的電氣<b class='flag-5'>測(cè)試</b>解決方案

    注射器滑動(dòng)性測(cè)試儀的基本測(cè)試原理

    文章由濟(jì)南三泉智能科技有限公司提供注射器滑動(dòng)性測(cè)試儀的原理主要是通過(guò)模擬注射器的推注動(dòng)作,以評(píng)估注射器芯桿在筒體內(nèi)部的滑動(dòng)性能。具體來(lái)說(shuō),其工作原理如下:固定與安裝:首先,將待測(cè)試的注射器筒體固定
    的頭像 發(fā)表于 05-24 14:18 ?452次閱讀
    注射器滑動(dòng)性<b class='flag-5'>測(cè)試</b>儀的基本<b class='flag-5'>測(cè)試</b>原理

    蓄電池整組充放電活化儀上位機(jī)軟件安裝說(shuō)明

    上位機(jī)軟件說(shuō)明1軟件安裝運(yùn)行SD卡上的setup.exe,用戶按照界面提示步驟進(jìn)行,即可完成數(shù)據(jù)管理軟件的安裝。2軟件運(yùn)行運(yùn)行“桌面-圖標(biāo)”或運(yùn)行“開(kāi)始-程序-蓄電池活化儀分析軟件從菜單中選擇“文件
    的頭像 發(fā)表于 04-08 13:39 ?372次閱讀
    蓄電池整組充放電活化儀上位機(jī)軟件<b class='flag-5'>安裝</b>說(shuō)明

    米爾全志T527開(kāi)發(fā)板安裝測(cè)試軟件

    在上1貼T527開(kāi)發(fā)板已上電安裝WIFI熱點(diǎn),這個(gè)帖子說(shuō)明如何安裝安兔兔測(cè)試軟件。 1)安卓13自帶瀏覽器沒(méi)有下載并安裝apk功能,請(qǐng)先用u盤安裝
    發(fā)表于 03-07 13:36

    探針測(cè)試臺(tái)工作原理 探針測(cè)試臺(tái)為嘛測(cè)試會(huì)偏大?

    探針測(cè)試臺(tái)是一種用于測(cè)試集成電路(IC)的設(shè)備,工作原理是將待測(cè)試的IC芯片安裝測(cè)試座上,然后通過(guò)探針接觸到芯片的引腳,以
    的頭像 發(fā)表于 02-04 15:14 ?3881次閱讀