OCR (Optical Character Recognition,光學(xué)字符識(shí)別)是指電子設(shè)備(例如掃描儀或數(shù)碼相機(jī))檢查紙上打印的字符,通過檢測暗、亮的模式確定其形狀,然后用字符識(shí)別方法將形狀翻譯成計(jì)算機(jī)文字的過程;即,針對印刷體字符,采用光學(xué)的方式將紙質(zhì)文檔中的文字轉(zhuǎn)換成為黑白點(diǎn)陣的圖像文件,并通過識(shí)別軟件將圖像中的文字轉(zhuǎn)換成文本格式,供文字處理軟件進(jìn)一步編輯加工的技術(shù)。如何除錯(cuò)或利用輔助信息提高識(shí)別正確率,是OCR最重要的課題,ICR(Intelligent Character Recognition)的名詞也因此而產(chǎn)生。衡量一個(gè)OCR系統(tǒng)性能好壞的主要指標(biāo)有:拒識(shí)率、誤識(shí)率、識(shí)別速度、用戶界面的友好性,產(chǎn)品的穩(wěn)定性,易用性及可行性等。
一、Vitis AI Library
Vitis AI Library是一組高層次庫和 API,專為利用 DPU 高效執(zhí)行 AI 推斷而構(gòu)建。它是基于 Vitis AI運(yùn)行時(shí)利用 Vitis運(yùn)行時(shí)統(tǒng)一 API 來構(gòu)建的,能夠?yàn)?XRT 提供完整支持。
Vitis AI Library 通過封裝諸多高效且高質(zhì)量的神經(jīng)網(wǎng)絡(luò),提供易用且統(tǒng)一的接口。由此可簡化深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的使用,對于不具備深度學(xué)習(xí)或 FPGA 知識(shí)的用戶也是如此。Vitis AI Library 使開發(fā)者能夠?qū)W⒂陂_發(fā)自己的應(yīng)用,而不是底層硬件。

二、實(shí)現(xiàn)
相較于Vitis AI Runtime,Vitis AI Library 有很多已經(jīng)封裝好的神經(jīng)網(wǎng)絡(luò)接口,直接拿來用即可。
OCR識(shí)別基于Vitis AI Library 的ocr_pt模型,OCR識(shí)別的代碼如下:
#include
#include
#include
#include
#include
#include
#include
#include
#include "./process_result.hpp"
int main(int argc, char* argv[]) {
std::string model = argv[1];
return vitis::ai::main_for_jpeg_demo(
argc, argv,
[model] {
return vitis::ai::OCR::create(model);
},
process_result, 2);
}
主要使用Vitis AI Library 的OCR功能(lvitis_ai_library-ocr),具體文字實(shí)現(xiàn)的代碼:
#include
#include
#include
#include
#include
#include
#include "vitis/ai/ocr.hpp"
using namespace cv;
using namespace std;
Scalar colors[] = { Scalar(255, 0, 0), Scalar(0, 255, 0), Scalar(255, 255, 0), Scalar(0, 0, 255) };
static cv::Mat process_result( cv::Mat &img,
const vitis::ai::OCRResult &result, bool is_jpeg) {
for(unsigned int i=0; i
代碼中可以看出,直接使用了openCV的功能。
三、編譯&運(yùn)行
build.sh文件內(nèi)容如下:
result=0 && pkg-config --list-all | grep opencv4 && result=1
if [ $result -eq 1 ]; then
OPENCV_FLAGS=$(pkg-config --cflags --libs-only-L opencv4)
else
OPENCV_FLAGS=$(pkg-config --cflags --libs-only-L opencv)
fi
CXX=${CXX:-g++}
for file in $(ls *.cpp); do
filename=${file%.*}
$CXX -std=c++17 -O2 -I. -o ${filename} ${file} -lvitis_ai_library-ocr -lvitis_ai_library-dpu_task -lvitis_ai_library-xnnpp -lvitis_ai_library-model_config -lvitis_ai_library-math -lvart-util -lxir -pthread -ljson-c -lglog ${OPENCV_FLAGS} -lopencv_core -lopencv_videoio -lopencv_imgproc -lopencv_imgcodecs -lopencv_highgui
done
執(zhí)行sh build.sh
生成可執(zhí)行文件。待測試的圖片如下:
執(zhí)行OCR識(shí)別后的結(jié)果如下:

總體情況識(shí)別速度很快,內(nèi)容識(shí)別無誤,不知道啥情況中間的“OF”不見了。
可以看出,Vitis AI Library 使開發(fā)者能夠?qū)W⒂陂_發(fā)自己的應(yīng)用,而不是底層硬件,快速部署AI相關(guān)應(yīng)用。
審核編輯:湯梓紅
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。
舉報(bào)投訴
-
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42
文章
4814
瀏覽量
103557
-
AI
+關(guān)注
關(guān)注
88
文章
35093
瀏覽量
279525
-
OCR
+關(guān)注
關(guān)注
0
文章
161
瀏覽量
16789
-
Vitis
+關(guān)注
關(guān)注
0
文章
150
瀏覽量
7941
發(fā)布評論請先 登錄
相關(guān)推薦
熱點(diǎn)推薦
AI開發(fā)平臺(tái)Vitis AI 2.5讓AI加速體驗(yàn)更上一層樓 Vitis AI新功能概述
Vitis AI 2.5 的模型庫增加了廣受歡迎的NLP及更多 CNN 模型,例如 Bert-base,Vision Transformer、端到端 OCR, 以及應(yīng)用于 SLAM 場景的SuperPoint 與 HFNet
發(fā)表于 07-14 17:40
?3.7w次閱讀
端側(cè)OCR文字識(shí)別實(shí)現(xiàn) -- Core Vision Kit ##HarmonyOS SDK AI##
制),我發(fā)送出去的base64是不全的。
總之,傳統(tǒng)方法做ocr流程上比較復(fù)雜,而原生鴻蒙開發(fā)提供了端側(cè)AI的能力,其中就包括了“Core Vision Kit(基礎(chǔ)視覺服務(wù))”,即與圖片識(shí)別相關(guān)的
發(fā)表于 06-30 18:07
Vitis AI Model Zone軟件平臺(tái)具備哪些功能?
Vitis AI Model Zone軟件平臺(tái)具備哪些功能?Vitis AI Model Zone軟件平臺(tái)的應(yīng)用范圍包括哪些?
發(fā)表于 07-09 06:44
【KV260視覺入門套件試用體驗(yàn)】部署vitis-ai環(huán)境以及測試demo
/ug1354-xilinx-ai-sdk/%E4%B8%8B%E8%BD%BD-Vitis-AI-Library
在安裝->設(shè)置目標(biāo)->步驟1:安裝開發(fā)板鏡像
開始下載鏡像
進(jìn)入到
發(fā)表于 08-27 23:35
【KV260視覺入門套件試用體驗(yàn)】Vitis AI 初次體驗(yàn)
連接到處理器系統(tǒng) (PS)。DPU 可由用戶配置且包含多個(gè)參數(shù),用戶可通過指定這些參數(shù)來對 PL 資源進(jìn)行最優(yōu)化,或者也可以自定義啟用的功能。
Vitis AI Library 是一組高層次庫和 API
發(fā)表于 09-10 13:15
【KV260視覺入門套件試用體驗(yàn)】五、VITis AI (人臉檢測和人體檢測)
一、DPU 鏡像環(huán)境配置
官方鏡像已經(jīng)安裝好了可以在安裝相關(guān)配置,示例來源Vitis AI Library用戶指南3.0版本,首先需要安裝DPU鏡像。
1.1、克隆Vitis
發(fā)表于 09-26 16:22
【KV260視覺入門套件試用體驗(yàn)】六、VITis AI車牌檢測&車牌識(shí)別
。下圖顯示了車牌檢測的結(jié)果。
將圖片中的車牌進(jìn)行了框選,同事標(biāo)準(zhǔn)位置。
4.2、車牌識(shí)別
cd ~/Vitis-AI/examples/vai_library/samples/platenum
發(fā)表于 09-26 16:28
【KV260視覺入門套件試用體驗(yàn)】七、VITis AI字符和文本檢測(OCR&Textmountain)
4.1、字符檢測
使用命令運(yùn)行代碼程序。
cd ~/Vitis-AI/examples/vai_library/samples/ocr
./test_jpeg_ocr
發(fā)表于 09-26 16:31
【KV260視覺入門套件試用體驗(yàn)】基于Vitis AI的ADAS目標(biāo)識(shí)別
/vitis_ai_library/models -r
四、ADAS目標(biāo)識(shí)別體驗(yàn)
(一)目標(biāo)識(shí)別
接上HDMI顯示器、鍵盤&鼠標(biāo),在KV260上執(zhí)行(如果在SSH或串口上執(zhí)行會(huì)提示cv
發(fā)表于 09-27 23:21
【KV260視覺入門套件試用體驗(yàn)】Vitis-AI加速的YOLOX視頻目標(biāo)檢測示例體驗(yàn)和原理解析
會(huì)對關(guān)鍵源碼進(jìn)行解析。
一、Vitis AI Library簡介
上一篇帖子中,我們了解了Vitis統(tǒng)一軟件平臺(tái)和Vitis
發(fā)表于 10-06 23:32
【KV260視覺入門套件試用體驗(yàn)】Vitis AI 構(gòu)建開發(fā)環(huán)境,并使用inspector檢查模型
FFT運(yùn)算(Vivado)
四、硬件加速之—使用PL加速矩陣乘法運(yùn)算(Vitis HLS)
五、Vitis AI 構(gòu)建開發(fā)環(huán)境,并使用inspector檢查模型
六、
發(fā)表于 10-14 15:34
【KV260視覺入門套件試用體驗(yàn)】Vitis AI Library體驗(yàn)之OCR識(shí)別
Vitis AI Runtime,Vitis AI Library 有很多已經(jīng)封裝好的神經(jīng)網(wǎng)絡(luò)接口,直接拿來用即可。
發(fā)表于 10-16 23:25
使用數(shù)字識(shí)別和AI實(shí)現(xiàn)OCR的資料合集
本文檔的主要內(nèi)容詳細(xì)介紹的是使用數(shù)字識(shí)別和AI實(shí)現(xiàn)OCR的資料合集。
發(fā)表于 07-17 08:00
?20次下載
如何使用Vitis AI Library來安裝、使用和開發(fā)應(yīng)用
Vitis AI Library 是一組高層次庫和 API,專為利用深度學(xué)習(xí)處理單元 (DPU) 來高效執(zhí)行 AI 推斷而構(gòu)建。
使用Vitis-AI進(jìn)行車牌識(shí)別
電子發(fā)燒友網(wǎng)站提供《使用Vitis-AI進(jìn)行車牌識(shí)別.zip》資料免費(fèi)下載
發(fā)表于 06-27 09:49
?2次下載
評論