0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

easyocr:超級(jí)簡(jiǎn)單且強(qiáng)大的OCR文本識(shí)別工具

科技綠洲 ? 來源:Python實(shí)用寶典 ? 作者:Python實(shí)用寶典 ? 2023-10-30 09:30 ? 次閱讀

今天給大家介紹一個(gè)超級(jí)簡(jiǎn)單且強(qiáng)大的OCR文本識(shí)別工具: easyocr .

這個(gè)模塊支持70多種語(yǔ)言的即用型OCR,包括中文,日文,韓文和泰文等。

下面是這個(gè)模塊的實(shí)戰(zhàn)教程。

1.準(zhǔn)備

開始之前,你要確保Pythonpip已經(jīng)成功安裝在電腦上,如果沒有,可以訪問這篇文章:超詳細(xì)Python安裝指南 進(jìn)行安裝。

如果你用Python的目的是數(shù)據(jù)分析,可以直接安裝Anaconda:Python數(shù)據(jù)分析與挖掘好幫手—Anaconda,它內(nèi)置了Python和pip.

此外,推薦大家用VSCode編輯器,它有許多的優(yōu)點(diǎn):Python 編程的最好搭檔—VSCode 詳細(xì)指南。

請(qǐng)選擇以下任一種方式輸入命令安裝依賴

  1. Windows 環(huán)境 打開 Cmd (開始-運(yùn)行-CMD)。
  2. MacOS 環(huán)境 打開 Terminal (command+空格輸入Terminal)。
  3. 如果你用的是 VSCode編輯器 或 Pycharm,可以直接使用界面下方的Terminal.
pip install easyocr

它會(huì)安裝除了模型文件之外的所有依賴,模型文件則會(huì)在運(yùn)行代碼的時(shí)候下載

對(duì)于Windows,如果在安裝 Torch 或 Torchvision 時(shí)報(bào)錯(cuò)了,請(qǐng)按照https://pytorch.org 的官方說明安裝 Torch 和 Torchvision。

如果你想使用顯卡進(jìn)行計(jì)算,你需要搜索下載CUDA,并在Pytorch網(wǎng)站上,確保選擇正確的CUDA版本。如果僅打算在CPU模式下運(yùn)行,請(qǐng)選擇CUDA = None。

2.實(shí)戰(zhàn)教程

這個(gè)模塊用起來真的非常簡(jiǎn)單,三行代碼完事了:

import easyocr
reader = easyocr.Reader(['ch_sim','en'])
result = reader.readtext('test.png')

運(yùn)行的過程中會(huì)安裝所需要的模型文件,像下面這樣:

圖片

不過它的下載速度非常慢,而且經(jīng)常會(huì)失敗,因此這里給出第二個(gè)解決方案:先下載好模型文件,再將其放置到所需要的位置:

上滑查看更多

文字檢測(cè)模型(CRAFT)(必須)

https://pythondict.com/go/?url=https://github.com/JaidedAI/EasyOCR/releases/download/pre-v1.1.6/craft_mlt_25k.zip

中文(簡(jiǎn)體)模型(識(shí)別中文必須)

https://pythondict.com/go/?url=https://github.com/JaidedAI/EasyOCR/releases/download/pre-v1.1.6/chinese_sim.zip

中國(guó)(傳統(tǒng))模型

https://pythondict.com/go/?url=https://github.com/JaidedAI/EasyOCR/releases/download/pre-v1.1.6/chinese.zip

拉丁模型

https://pythondict.com/go/?url=https://github.com/JaidedAI/EasyOCR/releases/download/pre-v1.1.6/latin.zip

日本模型

https://pythondict.com/go/?url=https://github.com/JaidedAI/EasyOCR/releases/download/pre-v1.1.6/japanese.zip

韓文模型

https://pythondict.com/go/?url=https://github.com/JaidedAI/EasyOCR/releases/download/pre-v1.1.6/korean.zip

泰文模型

https://pythondict.com/go/?url=https://github.com/JaidedAI/EasyOCR/releases/download/pre-v1.1.6/thai.zip

阿拉伯文模型

https://pythondict.com/go/?url=https://github.com/JaidedAI/EasyOCR/releases/download/pre-v1.1.6/arabic.zip

如果下載速度太慢,請(qǐng)?jiān)赑ython實(shí)用寶典公眾號(hào)后臺(tái)回復(fù): easyocr , 下載我上傳到微云網(wǎng)盤的文字檢測(cè)模型(CRAFT)和中文簡(jiǎn)體模型文件包。

下載完模型后,將文件放到下面這個(gè)位置。

Windows:C:Users用戶名.EasyOCRmodel
Linux~/ .EasyOCR / model

**如下圖所示:
**

圖片

重新執(zhí)行腳本不會(huì)再提醒下載模型了:

import easyocr
reader = easyocr.Reader(['ch_sim'])
result = reader.readtext('test.png')
print(result)

我隨便截了一個(gè)直播彈幕的圖片保存在腳本所在的文件夾下,命名為test.png:

結(jié)果如下:

圖片

基本上所有應(yīng)該識(shí)別的文字都識(shí)別出來了,效果非常不錯(cuò)。

另外也可以看到,輸出采用列表格式,每個(gè)item分別表示對(duì)應(yīng)文字的邊界框,識(shí)別文本結(jié)果和置信度。

這個(gè)模塊還能識(shí)別多語(yǔ)種的情況:

我將這張圖片命名為test2.jpg,修改代碼中對(duì)應(yīng)的圖片名稱:

import easyocr
reader = easyocr.Reader(['ch_sim','en'])
result = reader.readtext('test2.jpg')
print(result)

效果如下:

圖片

這張圖片很復(fù)雜,而且是中英文混雜在一起的情況,但是可以看到模型除了左上角的水印,圖片中的文字基本都是識(shí)別出來了,盡管有部分文字識(shí)別錯(cuò)誤,但還在可以接受的范圍之內(nèi)。

不過需要注意的是,雖然可以一次性識(shí)別許多種語(yǔ)言,但并非所有語(yǔ)言都可以一起用,通常是公共語(yǔ)言和一個(gè)特殊語(yǔ)種可以一起識(shí)別,相互兼容,比如英語(yǔ)和日語(yǔ)。

如果你的電腦沒有GPU或者顯存不足,可以加一個(gè)gpu=false的參數(shù)僅使用CPU運(yùn)行:

reader = easyocr.Reader(['ch_sim','en'], gpu = False)

另外,這個(gè)模塊還支持直接使用命令行運(yùn)行,相當(dāng)方便,大家可以試試:

easyocr -l ch_sim en -f test.png --detail=1 --gpu=True
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3243

    瀏覽量

    48840
  • python
    +關(guān)注

    關(guān)注

    56

    文章

    4797

    瀏覽量

    84687
  • OCR
    OCR
    +關(guān)注

    關(guān)注

    0

    文章

    144

    瀏覽量

    16360
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    首發(fā) | 告別手動(dòng)錄入,開放平臺(tái)OCR上線印刷文字識(shí)別!

    的就是印刷字體的轉(zhuǎn)化。二、印刷文字識(shí)別應(yīng)用廣泛正如文章開頭我們提到的,生活中有很多需要將印刷字體轉(zhuǎn)換為設(shè)備可編輯的文本場(chǎng)景。而作為OCR家族的重要成員,印刷文字識(shí)別在這時(shí)候就大有作為,
    發(fā)表于 05-17 15:18

    Python OCR 識(shí)別庫(kù)-ddddocr

    ;, 'rb') as f: image = f.read()res = ocr.classification(image)print(res)識(shí)別結(jié)果3n3d8342總結(jié)ddddocr 讓驗(yàn)證碼變得如此簡(jiǎn)單
    發(fā)表于 03-30 17:26

    【KV260視覺入門套件試用體驗(yàn)】七、VITis AI字符和文本檢測(cè)(OCR&Textmountain)

    _pt sample_ocr.jpg OCR 該網(wǎng)絡(luò)用于光學(xué)字符識(shí)別,包括文本檢測(cè)和文本識(shí)別
    發(fā)表于 09-26 16:31

    什么是OCR

    什么是OCR OCR的英文全稱: OCR是英文Optical Character Recognition的縮寫,意思是光學(xué)字符識(shí)別,也可簡(jiǎn)單
    發(fā)表于 04-10 12:55 ?6744次閱讀

    基于FPGA的OCR文字識(shí)別技術(shù)的深度解析

    OCR在通用文字識(shí)別等場(chǎng)景下有廣泛應(yīng)用,基于FPGA異構(gòu)加速的OCR識(shí)別相比CPU/GPU實(shí)現(xiàn)具有延時(shí)小、成本低的優(yōu)勢(shì)。我們?cè)O(shè)計(jì)了多FPGA芯片協(xié)同的異構(gòu)加速架構(gòu),能快速適配業(yè)務(wù)
    發(fā)表于 01-26 12:19 ?4011次閱讀

    關(guān)于開放平臺(tái)OCR上線印刷文字識(shí)別的介紹

    我們?yōu)槭裁从?b class='flag-5'>OCR?因?yàn)榭梢钥焖賹⑽淖洲D(zhuǎn)為可在設(shè)備上編輯的數(shù)字文本。因此能夠得到用戶青睞的OCR小編認(rèn)為應(yīng)能夠準(zhǔn)確生成文本,所見即所得,同時(shí)對(duì)不同字體,不同環(huán)境,不同顏色形狀的
    的頭像 發(fā)表于 09-27 09:51 ?2637次閱讀

    如何使用Python開發(fā)截圖識(shí)別OCR的小工具

     你一定用過那種“OCR神器”,可以把圖片中的文字提取出來,極大的提高工作效率。今天,我們就來做一款實(shí)時(shí)截圖識(shí)別的小工具。顧名思義,運(yùn)行程序時(shí),可以實(shí)時(shí)的把你截出來的圖片中的文字識(shí)別
    的頭像 發(fā)表于 01-04 11:27 ?3542次閱讀

    OCR識(shí)別技術(shù)

    在爬蟲對(duì)驗(yàn)證碼進(jìn)行破解時(shí),經(jīng)常需要對(duì)圖片中的文字內(nèi)容進(jìn)行識(shí)別,這時(shí)就需要用到OCR技術(shù)了,那么 OCR識(shí)別技術(shù)是如何實(shí)現(xiàn)對(duì)文字內(nèi)容“即拍即得”的呢?
    的頭像 發(fā)表于 03-12 09:07 ?4817次閱讀

    機(jī)器視覺運(yùn)動(dòng)控制一體機(jī)應(yīng)用例程|OCR字符識(shí)別應(yīng)用

    應(yīng)用背景 OCR字符識(shí)別的應(yīng)用場(chǎng)景非常廣泛,例如在生產(chǎn)型企業(yè)領(lǐng)域中,OCR具有多樣性的應(yīng)用,比如讀取儀表儀器上的文本,進(jìn)行實(shí)時(shí)監(jiān)控、讀取產(chǎn)品上的生產(chǎn)日期、批號(hào),以此來獲得產(chǎn)品的信息和可
    的頭像 發(fā)表于 02-24 17:27 ?1427次閱讀
    機(jī)器視覺運(yùn)動(dòng)控制一體機(jī)應(yīng)用例程|<b class='flag-5'>OCR</b>字符<b class='flag-5'>識(shí)別</b>應(yīng)用

    樹洞OCR文字識(shí)別跨平臺(tái)的OCR工具

    ./oschina_soft/tools-ocr.zip
    發(fā)表于 05-30 09:42 ?5次下載
    樹洞<b class='flag-5'>OCR</b>文字<b class='flag-5'>識(shí)別</b>跨平臺(tái)的<b class='flag-5'>OCR</b>小<b class='flag-5'>工具</b>

    OCR算法能較好識(shí)別水平排布的常規(guī)文本

    OCR技術(shù)發(fā)展到今天,對(duì)于常規(guī)文本識(shí)別已經(jīng)達(dá)到了較高的準(zhǔn)確率。
    的頭像 發(fā)表于 08-08 16:04 ?1357次閱讀

    OCR光學(xué)圖文識(shí)別

    使用OCR功能,您可以簡(jiǎn)單地將掃描的PDF和基于圖像的PDF轉(zhuǎn)換為具有可編輯、可選擇和可搜索內(nèi)容的各種格式,例如MicrosoftOffice格式、PPT、頁(yè)面或純文本文檔(TXT文件)。
    的頭像 發(fā)表于 08-19 15:23 ?883次閱讀

    OCR實(shí)戰(zhàn)教程

    OCR 是光學(xué)字符識(shí)別(英語(yǔ):Optical Character Recognition,OCR)是指對(duì)文本資料的圖像文件進(jìn)行分析識(shí)別處理,
    的頭像 發(fā)表于 02-24 10:36 ?1002次閱讀
    <b class='flag-5'>OCR</b>實(shí)戰(zhàn)教程

    介紹一款簡(jiǎn)單強(qiáng)大的時(shí)序圖繪制工具

    Wavedrom 是一款功能強(qiáng)大簡(jiǎn)單易用的文本轉(zhuǎn)圖表工具,被廣泛應(yīng)用于生成時(shí)序圖、波形圖等交互式波形。其特點(diǎn)在于使用
    的頭像 發(fā)表于 08-15 12:26 ?1.2w次閱讀
    介紹一款<b class='flag-5'>簡(jiǎn)單</b><b class='flag-5'>強(qiáng)大</b>的時(shí)序圖繪制<b class='flag-5'>工具</b>

    OCR如何自動(dòng)識(shí)別圖片文字

    OCR 是光學(xué)字符識(shí)別(英語(yǔ):Optical Character Recognition,OCR)是指對(duì)文本資料的圖像文件進(jìn)行分析識(shí)別處理,
    的頭像 發(fā)表于 10-31 16:45 ?781次閱讀
    <b class='flag-5'>OCR</b>如何自動(dòng)<b class='flag-5'>識(shí)別</b>圖片文字