0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI提取圖片里包含的文字信息-解決文字無(wú)法復(fù)制的痛點(diǎn)

DS小龍哥-嵌入式技術(shù) ? 來(lái)源:DS小龍哥-嵌入式技術(shù) ? 作者:DS小龍哥-嵌入式技 ? 2023-07-07 09:37 ? 次閱讀

1. 前言

平時(shí)工作中編寫開(kāi)發(fā)技術(shù)文檔,或者學(xué)生在編寫論文時(shí),經(jīng)常會(huì)上網(wǎng)搜索一些參考文獻(xiàn)、文檔。

比如: 上網(wǎng)搜索相似的內(nèi)容參考一下或者引用別人的一段文字,有時(shí)候看到一篇較好的內(nèi)容想要保存等等。

這個(gè)過(guò)程中會(huì)發(fā)現(xiàn),很多網(wǎng)站的提供的頁(yè)面都是不能復(fù)制粘貼的,或者直接是圖片形式提供,為了方便能獲取這些文字,當(dāng)前就利用華為云提供的 通用文字識(shí)別接口,識(shí)別圖片里的文本內(nèi)容,方便復(fù)制文字。這個(gè)功能QQ上也集成了,使用很方便,這里利用華為云的接口實(shí)現(xiàn)一個(gè)與QQ類似的功能,截圖之后識(shí)別圖片里包含的文本內(nèi)容。

這個(gè)文字識(shí)別接口里不僅僅有通用文字識(shí)別功能,還支持很多其他功能:比如身份證、駕駛證、保險(xiǎn)單、手寫文本、火車票,行駛證.......等等功能。還支持用戶自定義識(shí)別模板,指定需要識(shí)別的關(guān)鍵字段,實(shí)現(xiàn)用戶特定格式圖片的自動(dòng)識(shí)別和結(jié)構(gòu)化提取。

image-20220214142233066

2. 文本識(shí)別接口使用介紹

2.1 開(kāi)通服務(wù)

地址: https://console.huaweicloud.com/ocr/?region=cn-north-4#/ocr/overview

image-20220214142605756

這個(gè)文字識(shí)別服務(wù)是按調(diào)用次數(shù)計(jì)費(fèi)的,每個(gè)用戶每月有1000次的免費(fèi)調(diào)用次數(shù),開(kāi)通服務(wù)后就可以使用。

2.2 接口地址

官網(wǎng)幫助文檔: https://support.huaweicloud.com/api-ocr/ocr_03_0042.html

POST https://{endpoint}/v2/{project_id}/ocr/general-text

示例:
https://ocr.cn-north-4.myhuaweicloud.com/v2/0e5957be8a00f53c2fa7c0045e4d8fbf/ocr/general-text

請(qǐng)求頭:
{
 "X-Auth-Token": "******",
 "Content-Type": "application/json;charset=UTF-8"
}

請(qǐng)求體:
{
 "image": ----這是圖片的bas64編碼
}

響應(yīng)結(jié)果:
{
 "result": {
  "words_block_count": 13,
  "words_block_list": [
   {
    "words": "撤,還是不撤?",
    "location": [
     [
      43,
      39
     ],
     [
      161,
      39
     ],
     [
      161,
      60
     ],
     [
      43,
      60
     ]
    ]
   },
   {
    "words": "讓我更驕傲的是公司在大災(zāi)面前的表現(xiàn)。",
    "location": [
     [
      72,
      95
     ],
     [
      332,
      95
     ],
     [
      332,
      113
     ],
     [
      72,
      113
     ]
    ]
   },
   {
    "words": "2011年3月11日14時(shí)46分,日本東北部海域發(fā)生里氏9.0級(jí)",
    "location": [
     [
      71,
      122
     ],
     [
      482,
      122
     ],
     [
      482,
      142
     ],
     [
      71,
      142
     ]
    ]
   },
   {
    "words": "地震并引發(fā)海嘯。那一刻,我們正在距離東京100公里的熱海開(kāi)會(huì),",
    "location": [
     [
      41,
      149
     ],
     [
      481,
      149
     ],
     [
      481,
      171
     ],
     [
      41,
      171
     ]
    ]
   },
   {
    "words": "感覺(jué)“咚”",
    "location": [
     [
      42,
      180
     ],
     [
      114,
      180
     ],
     [
      114,
      199
     ],
     [
      42,
      199
     ]
    ]
   },
   {
    "words": "地被震了一下。面對(duì)地震,",
    "location": [
     [
      115,
      178
     ],
     [
      296,
      178
     ],
     [
      296,
      199
     ],
     [
      115,
      199
     ]
    ]
   },
   {
    "words": "大家都很鎮(zhèn)定,",
    "location": [
     [
      300,
      179
     ],
     [
      400,
      179
     ],
     [
      400,
      197
     ],
     [
      300,
      197
     ]
    ]
   },
   {
    "words": "直到看到電",
    "location": [
     [
      405,
      179
     ],
     [
      483,
      179
     ],
     [
      483,
      196
     ],
     [
      405,
      196
     ]
    ]
   },
   {
    "words": "視上觸目驚心的畫面:15時(shí) 25 分,海嘯到達(dá)陸前高田市海岸;15時(shí)",
    "location": [
     [
      41,
      206
     ],
     [
      485,
      206
     ],
     [
      485,
      228
     ],
     [
      41,
      228
     ]
    ]
   },
   {
    "words": "26分,海嘯到達(dá)陸前高田市中心;15時(shí)43分,陸前高田市依稀只能",
    "location": [
     [
      40,
      234
     ],
     [
      486,
      234
     ],
     [
      486,
      258
     ],
     [
      40,
      258
     ]
    ]
   },
   {
    "words": "看到四層高的市府大樓的屋頂,一瞬間,城鎮(zhèn)就變成了汪洋……對(duì)",
    "location": [
     [
      40,
      262
     ],
     [
      487,
      262
     ],
     [
      487,
      287
     ],
     [
      40,
      287
     ]
    ]
   },
   {
    "words": "我來(lái)說(shuō),地震跟家常便飯一樣,可眼前的災(zāi)難比以往任何一次都要",
    "location": [
     [
      40,
      292
     ],
     [
      487,
      292
     ],
     [
      487,
      317
     ],
     [
      40,
      317
     ]
    ]
   },
   {
    "words": "慘烈,完全超出了我的預(yù)期。",
    "location": [
     [
      41,
      326
     ],
     [
      231,
      326
     ],
     [
      231,
      345
     ],
     [
      41,
      345
     ]
    ]
   }
  ],
  "direction": -1
 }
}

在請(qǐng)求參數(shù)里的X-Auth-Token參數(shù)比較重要,調(diào)用華為云的任何API接口都需要這個(gè)參數(shù),獲取方式可以看前面的文章。比如這篇文章: https://support.huaweicloud.com/api-ocr/ocr_03_0005.html

2.3 在線調(diào)試接口

地址: https://apiexplorer.developer.huaweicloud.com/apiexplorer/debug?product=OCR&api=RecognizeGeneralText

使用調(diào)試接口想體驗(yàn)識(shí)別效果,圖片的數(shù)據(jù)支持base64編碼、http網(wǎng)絡(luò)圖片地址傳入,測(cè)試非常方便。

關(guān)于獲取圖片base64編碼的方式,在文檔里也有介紹,直接通過(guò)瀏覽器獲取。

image-20220214144146775

image-20220214143945486

3. 實(shí)現(xiàn)代碼

代碼采用QT編寫的,請(qǐng)求API接口實(shí)現(xiàn)調(diào)用。其他語(yǔ)言方法是一樣的。

3.1 實(shí)現(xiàn)效果

image-20220214144917259

image-20220214144825170

3.2 核心代碼

//解析反饋結(jié)果
void Widget::replyFinished(QNetworkReply *reply)
{
    QString displayInfo="";
    int statusCode = reply- >attribute(QNetworkRequest::HttpStatusCodeAttribute).toInt();

    //讀取所有數(shù)據(jù)
    QByteArray replyData = reply- >readAll();

    qDebug()< "狀態(tài)碼:"<

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 接口
    +關(guān)注

    關(guān)注

    33

    文章

    8605

    瀏覽量

    151189
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    30898

    瀏覽量

    269128
  • 文字識(shí)別
    +關(guān)注

    關(guān)注

    0

    文章

    16

    瀏覽量

    8638
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    推薦幾個(gè)去掉圖片上的文字的技巧!!

    文字 區(qū)域拖動(dòng)鼠標(biāo)復(fù)制以復(fù)蓋文字。 要注意的是,采樣點(diǎn)即為復(fù)制的 起始點(diǎn)。選擇不同的筆刷直徑會(huì)影響繪制的范圍,而不同的筆刷 硬度會(huì)影響繪制
    發(fā)表于 06-02 18:08

    提取圖片中的文字

    用單片機(jī)控制攝像頭拍照后,怎么能提取出照片上的文字呢??有沒(méi)有大神給點(diǎn)建議啊
    發(fā)表于 03-12 20:37

    AI文字識(shí)別】lingxin-yuhe Codelab記錄帖

    `1、下載開(kāi)發(fā)工具,很簡(jiǎn)單的安裝過(guò)程。2、根據(jù)AI文字識(shí)別建立工程。3、根據(jù)文檔一步一步布局,寫邏輯。4、下載符合要求的圖片,內(nèi)帶較清晰的文字。5、啟動(dòng)模擬器,運(yùn)行程序。上圖:`
    發(fā)表于 04-14 22:00

    基于AI通用文字識(shí)別能力,檢測(cè)和識(shí)別文檔翻拍、街景翻拍等圖片中的文字

    結(jié)果"下方看到包含關(guān)鍵詞的圖片。垃圾分類人人做 做好分類為人人可回收物 其他垃圾通過(guò)本教程的學(xué)習(xí),你已學(xué)會(huì)如何使用AI能力中的通用文字識(shí)別和分詞。
    發(fā)表于 08-27 11:27

    C#教程之圖片上繪制文字

    C#教程之圖片上繪制文字,很好的C#資料,快來(lái)學(xué)習(xí)吧。
    發(fā)表于 04-20 11:13 ?5次下載

    基于matlab的文字識(shí)別算法

    在圖像中,文字信息包含了豐富的高層語(yǔ)義信息提取出這些文字,對(duì)于圖像高層語(yǔ)義的理解、索引和檢索非
    發(fā)表于 01-15 10:31 ?3w次閱讀
    基于matlab的<b class='flag-5'>文字</b>識(shí)別算法

    如何提取和檢測(cè)視頻中的文字?數(shù)字視頻中文字的檢測(cè)提取技術(shù)的分析

    作為一種高級(jí)語(yǔ)義特征, 視頻中的文字信息對(duì)視頻內(nèi)容的理解、索引和檢索具有重要意義。本文針對(duì)非壓縮域中視頻文字的檢測(cè)與提取技術(shù)做了詳盡的分析和討論, 涉及的內(nèi)容包括:
    發(fā)表于 09-17 17:58 ?26次下載
    如何<b class='flag-5'>提取</b>和檢測(cè)視頻中的<b class='flag-5'>文字</b>?數(shù)字視頻中<b class='flag-5'>文字</b>的檢測(cè)<b class='flag-5'>提取</b>技術(shù)的分析

    如何在電腦中對(duì)圖片文字進(jìn)行局部識(shí)別

    ? ? 相信很多人和小編一樣電腦中保存了一些帶有文字圖片,有時(shí)候因?yàn)樾枰獣?huì)將里面的文字進(jìn)行提取,然而又不想對(duì)著圖片一個(gè)字一個(gè)字的打出來(lái),這
    發(fā)表于 11-13 14:07 ?590次閱讀

    怎樣簡(jiǎn)單識(shí)別提取圖中文字

      相信很多人都和小編一樣有這樣一個(gè)煩惱,經(jīng)常需要將圖片或者掃描件中的文字提取出來(lái),應(yīng)用到別的地方去,這個(gè)時(shí)候你該不會(huì)傻傻的手動(dòng)敲出文字吧,這種方法簡(jiǎn)直太麻煩了,而且耽誤時(shí)間,下面小編
    發(fā)表于 03-26 14:41 ?1036次閱讀

    文字區(qū)域提取源代碼免費(fèi)下載

    本文檔的主要內(nèi)容詳細(xì)介紹的是文字區(qū)域提取源代碼免費(fèi)下載。
    發(fā)表于 01-09 08:00 ?1次下載
    <b class='flag-5'>文字</b>區(qū)域<b class='flag-5'>提取</b>源代碼免費(fèi)下載

    曝騰訊QQ發(fā)生崩潰 部分群聊無(wú)法發(fā)送文字圖片

    3月10日午間,騰訊QQ突然出現(xiàn)崩潰現(xiàn)象,部分群聊無(wú)法發(fā)送文字圖片內(nèi)容,只能發(fā)送表情、文檔。
    的頭像 發(fā)表于 03-10 14:27 ?3473次閱讀

    使用javascript實(shí)現(xiàn)文字圖片上下滾動(dòng)的代碼免費(fèi)下載

    本文檔的主要內(nèi)容詳細(xì)介紹的是使用javascript實(shí)現(xiàn)文字圖片上下滾動(dòng)的代碼免費(fèi)下載。
    發(fā)表于 02-02 14:36 ?9次下載

    淺析HarmonyOS基于AI的通用文字識(shí)別技術(shù)

    在資訊大爆炸的時(shí)代,我們經(jīng)常面臨文件、圖片找不到的情況,HarmonyOS基于AI的通用文字識(shí)別技術(shù),可以有效幫助我們解決這些難題。 基于AI的通用
    的頭像 發(fā)表于 08-20 10:42 ?3178次閱讀

    如何用Java幾行代碼從圖片提取文字

    近日瀏覽網(wǎng)上一些圖片提取文字的網(wǎng)站,覺(jué)得甚是有趣,花費(fèi)半日也做了個(gè)在線圖片識(shí)別程序,完成了兩個(gè)技術(shù)方案的選擇,一是tesseract+python flask的方案實(shí)現(xiàn),二是
    的頭像 發(fā)表于 10-28 14:05 ?2000次閱讀
    如何用Java幾行代碼從<b class='flag-5'>圖片</b><b class='flag-5'>提取</b><b class='flag-5'>文字</b>

    圖片文字識(shí)別:揭開(kāi)數(shù)字世界的神秘面紗

    隨著數(shù)字化時(shí)代的到來(lái),我們生活中的大部分?jǐn)?shù)據(jù)都以圖片的形式存在。然而,這些圖片中蘊(yùn)含的信息往往比文字更豐富,如何從這些圖片中提取有價(jià)值的
    的頭像 發(fā)表于 05-11 18:20 ?615次閱讀