0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何使用Python把圖片變成文字

Wildesbeast ? 來源:今日頭條 ? 作者:玩物有智 ? 2020-02-15 14:40 ? 次閱讀

為什么要讓孩子學(xué)編程?看了這篇文章,你就知道編程的強大之處了!

你遇到以下的情況嗎?

你負責(zé)整理一些文件,結(jié)果發(fā)現(xiàn)文件沒有word存檔,這又需要我們把圖片變成word。

或者是在今日頭條上看到了某片好文章,結(jié)果內(nèi)容卻是圖片,你特別想把他變成文字分享給朋友。

如果你遇到過這些問題,千萬不要錯過 pytesseract 這個好工具!它能夠用很簡單、基礎(chǔ)的方法將圖片轉(zhuǎn)換成文字(分辨圖片中的文字)。在我們開始介紹 pytesseract 這個 Python 模塊之前,先來認識一下 Tesseract OCR 到底是什么吧!

OCR 與 Tesseract

OCR 為光學(xué)文字識別的縮寫(Optical Character Recognition,OCR),白話一點就是將圖片翻譯為文字。而 Tesseract 是一個 OCR 模組,目前由 Google 贊助。Tesseract 已經(jīng)有 30 年歷史,一開始它是惠普實驗室的一款專利軟體,于 2005 年開源,從 2006 年后由 Google 贊助進行后續(xù)的開發(fā)和維護, Tesseract 也是目前公認最優(yōu)秀、最精準(zhǔn)的開源 OCR 系統(tǒng)。

除了極高的精準(zhǔn)度外,Tesseract 也有很高的靈活性,能夠通過訓(xùn)練識別出任何字體(只要這些字體的風(fēng)格不變就可以),也能識別出任何 Unicode 字符,是不是非常厲害呢?我們待會會用到的 pytesseract 模塊就像是Tesseract的 python 包。

下面讓我們來動手嘗試下:

第一步 安裝模塊

pip3 install pillowpip3 install pytesseract

第二步 編寫程序

from PIL import Imageimport pytesseractimg = Image.open('test1.png')text = pytesseract.image_to_string(img, lang='eng')print(text)

首先,第一行和第二行是將我們剛剛安裝的模塊導(dǎo)入到程序中。

PIL 包含在剛剛安裝的 pillow 模組,其中的 Image 模組能夠讀取圖片檔。

我們將想要轉(zhuǎn)成文字的圖片檔,放在和這支程式相同的目錄。

第四行的 'test1.png' 是相對于這個程序(.py文件)的路徑,也就是該圖片的文件名,因此必須放在同一個資料夾程序才找得到文件,而且文件名與路徑名都是不可省略的。

所有辨識文字、轉(zhuǎn)換的複雜過程全部都寫在 pytesseract 中了,我們只需要知道如何調(diào)用即可。接著看到第五行,image_to_string函式有一個關(guān)鍵字引數(shù) lang,默認是英文,可以改變成你想要的語言字串。

結(jié)語

簡單暴力,5行代碼就可以將圖片轉(zhuǎn)化為文字,是不是很方便呢?除了生活中的一些小問題能用 pytesseract 解決,在開發(fā)爬蟲程序時,經(jīng)常會遇到需要驗證碼的情況,這時就能利用這個模塊輕松解決。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • word
    +關(guān)注

    關(guān)注

    1

    文章

    78

    瀏覽量

    21978
  • Unicode
    +關(guān)注

    關(guān)注

    0

    文章

    24

    瀏覽量

    12584
  • python
    +關(guān)注

    關(guān)注

    56

    文章

    4802

    瀏覽量

    84889
收藏 人收藏

    評論

    相關(guān)推薦

    將電腦硬盤變成云存儲,怎么做到多余電腦硬盤變成云存儲

    要將電腦的額外硬盤配置為云存儲,你可以利用多種方法來實現(xiàn)本地數(shù)據(jù)的云端同步、訪問和共享。這種做法可以將本地硬盤變成云存儲的一部分,方便你在不同設(shè)備之間共享和訪問文件。下面將介紹如何使用本地NAS
    的頭像 發(fā)表于 01-06 13:09 ?128次閱讀
    將電腦硬盤<b class='flag-5'>變成</b>云存儲,怎么做到<b class='flag-5'>把</b>多余電腦硬盤<b class='flag-5'>變成</b>云存儲

    電腦變成云存儲nsa,電腦變成云存儲nsa的教程,個人云電腦是什么以及怎么連接

    嗨,我是個茶藝師,準(zhǔn)備茶藝表演時,需要查閱不同茶葉的沖泡方法、茶文化資料,手機內(nèi)存有限。通過遠程連接工作室電腦,我能大量獲取資料,茶藝表演更精彩。現(xiàn)在,我這遠程茶藝提升的方法分享給同行,傳播茶文化
    的頭像 發(fā)表于 01-02 09:10 ?119次閱讀
    電腦<b class='flag-5'>變成</b>云存儲nsa,電腦<b class='flag-5'>變成</b>云存儲nsa的教程,個人云電腦是什么以及怎么連接

    使用Python+OpenCV處理圖片

    如果給你一張圖片作為背景,另外一張圖片中的物體作為前景圖,要把前景圖中的物體疊加布置到背景圖的中間位置,并且前景圖中的物體需要在背景圖中有旋轉(zhuǎn)和投影,怎么處理?
    的頭像 發(fā)表于 12-23 15:54 ?230次閱讀

    個人電腦變成云電腦,個人電腦變成云電腦的步驟

    ? ? 云電腦在現(xiàn)代工作和生活中扮演著越來越重要的角色,用戶可以通過遠程桌面軟件,像操作本地計算機一樣訪問和控制遠程計算機,無論它們位于何處。今天小編給大家分享個人電腦變成云電腦的步驟。 ? ?將
    的頭像 發(fā)表于 12-23 13:28 ?192次閱讀
    <b class='flag-5'>把</b>個人電腦<b class='flag-5'>變成</b>云電腦,<b class='flag-5'>把</b>個人電腦<b class='flag-5'>變成</b>云電腦的步驟

    pytorch和python的關(guān)系是什么

    在當(dāng)今的人工智能領(lǐng)域,Python已經(jīng)成為了最受歡迎的編程語言之一。Python的易學(xué)易用、豐富的庫和框架以及強大的社區(qū)支持,使其成為了數(shù)據(jù)科學(xué)、機器學(xué)習(xí)和深度學(xué)習(xí)等領(lǐng)域的首選語言。而在深度學(xué)習(xí)領(lǐng)域
    的頭像 發(fā)表于 08-01 15:27 ?2142次閱讀

    【算能RADXA微服務(wù)器試用體驗】+ GPT語音與視覺交互:4,文字轉(zhuǎn)語音

    文字轉(zhuǎn)語音使用的技術(shù)簡稱為TTS。一般情況下我用的都是在線的EDGE-TTS服務(wù)。但非常幸運的是,BM1684X上居然有適配好的本地運行TTS,那自然是要體驗一番。 先轉(zhuǎn)到project文件夾
    發(fā)表于 07-15 23:18

    使用PKI生成文件,at指令連接aws報錯怎么解決?

    我使用PKI生成文件,使用腳本生成ca,cert,key這三份證書,使用的命令是:python AtPKI.py generate_bin -b ./mqtt_key.bin cert
    發(fā)表于 06-27 06:43

    STM32MP135如何使用opencv-python或v4l2-ctl打開攝像頭,并保存為圖片?

    行。 但是官方的例程中,直接用v4l推送到media上,直接顯示的又是可以的。 請問我該如何使用opencv-python 或v4l2-ctl打開攝像頭,并保存為圖片?
    發(fā)表于 05-30 06:16

    labview圖片轉(zhuǎn)成base64

    各位大佬們,請教一下如何在labview中圖片轉(zhuǎn)成base64編碼,然后傳給Python,或者是然后用labview和Python之間傳遞圖片
    發(fā)表于 05-08 01:04

    有誰知道如何在熱敏打印機中實現(xiàn)圖片的灰階打印效果嗎?

    有誰知道如何在熱敏打印機中實現(xiàn)圖片的灰階打印效果。 現(xiàn)在基本上文字打印,圖片打印功能都已開發(fā)結(jié)束,圖片打印現(xiàn)在用的是點陣打印的方法。想增加灰階打印的效果。 有哪個大神做過相關(guān)方面開發(fā),
    發(fā)表于 04-24 15:43

    HarmonyOS開發(fā)案例:【圖片編輯】

    基于canvas組件、圖片編解碼,介紹了圖片編輯實現(xiàn)過程。
    的頭像 發(fā)表于 04-22 16:42 ?960次閱讀
    HarmonyOS開發(fā)案例:【<b class='flag-5'>圖片</b>編輯】

    鴻蒙OS開發(fā)實例:【瀑布流式圖片瀏覽】

    瀑布流式展示圖片文字,在當(dāng)前產(chǎn)品設(shè)計中已非常常見,本篇將介紹關(guān)于WaterFlow的圖片瀏覽場景,順便集成Video控件,以提高實踐的趣味性
    的頭像 發(fā)表于 03-29 17:38 ?1226次閱讀
    鴻蒙OS開發(fā)實例:【瀑布流式<b class='flag-5'>圖片</b>瀏覽】

    MX生成文件touchGFX無法成功編譯是哪里出了問題?

    1、MX生成文件時,toolchian工具選擇keil且touchGFX選擇高版本時,生成文件可以成功在touchGFX不可以成功編譯。 2、toolchian工具選擇IDE且touchGFX選擇
    發(fā)表于 03-13 07:40

    MB91530_590 EVB板添加字庫,能顯示圖片但是沒有文字顯示是為什么?

    我的 MB91530_590EVB板在應(yīng)用例程中添加字庫 能顯示圖片但是沒有文字顯示。 我是在開發(fā)板的例程中修改的。 我是按照文檔一步一步做的,為什么顯示不出文字,有知道原因的請盡快回復(fù),不勝感激。 最后顯示的結(jié)果:沒有
    發(fā)表于 02-22 08:19

    鴻蒙開發(fā)教學(xué)-圖片的引用

    該接口通過圖片數(shù)據(jù)源獲取圖片,支持本地圖片和網(wǎng)絡(luò)圖片的渲染展示。其中,src是圖片的數(shù)據(jù)源。
    的頭像 發(fā)表于 02-01 17:36 ?743次閱讀
    鴻蒙開發(fā)教學(xué)-<b class='flag-5'>圖片</b>的引用