0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

解析OpenVINO? + SSD 實(shí)時(shí)對(duì)象檢測(cè)

英特爾物聯(lián)網(wǎng) ? 來源:英特爾物聯(lián)網(wǎng) ? 作者:英特爾物聯(lián)網(wǎng) ? 2021-05-18 09:35 ? 次閱讀

前面我們了解OpenVINO 如何部署圖像分類網(wǎng)絡(luò)ResNet,本文我們將會(huì)學(xué)習(xí)OpenVINO 中對(duì)象檢測(cè)網(wǎng)絡(luò)的部署與推理應(yīng)用。說到對(duì)象檢測(cè)網(wǎng)絡(luò),我們首先需要理解兩個(gè)概念:對(duì)象檢測(cè)與對(duì)象檢測(cè)網(wǎng)絡(luò)。

SSD對(duì)象檢測(cè)模型

對(duì)象檢測(cè)是計(jì)算機(jī)視覺核心任務(wù)之一,也是最常見與應(yīng)用最廣泛的視覺場(chǎng)景。OpenVINO 已經(jīng)提供了以下通用場(chǎng)景下的對(duì)象檢測(cè)包括人臉檢測(cè)、行人檢測(cè)、物體檢測(cè)、車輛檢測(cè)、車牌檢測(cè)等,一個(gè)圖像對(duì)象檢測(cè)顯示示意圖如下:

圖-1(來自SSD論文)

相比圖像分類,對(duì)象檢測(cè)多了每個(gè)對(duì)象位置信息,所以簡(jiǎn)單的認(rèn)為對(duì)象檢測(cè)=圖像分類+Box位置信息。第一個(gè)深度學(xué)習(xí)相關(guān)的對(duì)象檢測(cè)網(wǎng)絡(luò)正是基于這樣思想的RCNN模型,但是它的缺點(diǎn)是無法實(shí)時(shí),所以2015年底有人提出了一個(gè)實(shí)時(shí)對(duì)象檢測(cè)網(wǎng)絡(luò)Single Shot MultiBox Detector縮寫為SSD。它的模型結(jié)構(gòu)如下:

23b73396-b4ff-11eb-bf61-12bb97331649.png

圖2(來自SSD論文)

圖2中SSD對(duì)象檢測(cè)網(wǎng)絡(luò)簡(jiǎn)單說可以分為三個(gè)部分:

- 基礎(chǔ)網(wǎng)絡(luò)(backbone) 這里為VGG16

- 特征提取Neck,構(gòu)建多尺度特征

- 檢測(cè)頭 – 非最大抑制與輸出

OpenVINO 中模型庫(kù)自帶預(yù)訓(xùn)練的人臉檢測(cè)網(wǎng)絡(luò)有很多,分別針對(duì)不同的應(yīng)用場(chǎng)景與輸入分辨率。這里我們以face-detection-0202人臉檢測(cè)模型為例說明,它是一個(gè)MobileNetV2作為基礎(chǔ)網(wǎng)絡(luò)的SSD對(duì)象檢測(cè)模型,模型支持的輸入圖像大小與格式如下:

NCHW=1x3x384x384其中

N表示圖像數(shù)目,這里為1

C表示輸入圖像通道數(shù)目,這里彩色圖像為3

H表示圖像高度

W表示圖像寬度

期望的圖像通道順序:BGR

23f26fa6-b4ff-11eb-bf61-12bb97331649.png

圖-3

模型推理計(jì)算得輸出格式為:

1x1xNx7其中

N表示檢測(cè)到的對(duì)象數(shù)目

7表示[image_id, label, conf, x_min, y_min, x_max, y_max]這七個(gè)值,其中

Image_id 表示圖像編號(hào),這個(gè)輸入的是一張圖像,base為0

Label 表示標(biāo)簽,跟數(shù)據(jù)集的label_map文本文件相關(guān),根據(jù)標(biāo)簽編號(hào)可以查找標(biāo)簽文本名

Conf 表示對(duì)象的置信度,取值范圍在0~1之間,值越大表示置信程度越高

x_min, y_min, x_max, y_max 四個(gè)值對(duì)象位置信息,分別是左上角與有下角的坐標(biāo)

該模型的相關(guān)性能參數(shù)如下:

圖-4

從上面我們可以知道模型來自Pytorch訓(xùn)練生成。

OpenVINO基于SSD模型實(shí)時(shí)人臉檢測(cè)

現(xiàn)在我們已經(jīng)了解SSD模型的基本網(wǎng)絡(luò)結(jié)構(gòu),OpenVINO 自帶SSD人臉檢測(cè)模型face-detection-0202的輸入與輸出相關(guān)格式與參數(shù)細(xì)節(jié)信息,這里我們就基于該模型使用OpenVINO 中的推理引擎模型實(shí)現(xiàn)一個(gè)實(shí)時(shí)人臉檢測(cè)應(yīng)用,根據(jù)之前的內(nèi)容,我們首先需要加載模型,相關(guān)代碼如下:

// 加載檢測(cè)模型

auto network = ie.ReadNetwork(model_xml, model_bin);

其中

model_xml表示face-detection-0202模型文件

model_bin表示face-detection-0202權(quán)重文件

然后設(shè)置模型的輸入與輸出相關(guān)的格式,代碼如下:

// 請(qǐng)求網(wǎng)絡(luò)輸入與輸出信息

InferenceEngine::InputsDataMap input_info(network.getInputsInfo());

InferenceEngine::OutputsDataMap output_info(network.getOutputsInfo());

// 設(shè)置輸入格式

for (auto &item : input_info) {

auto input_data = item.second;

input_data->setPrecision(Precision::U8);

input_data->setLayout(Layout::NCHW);

}

printf("get it ");

// 設(shè)置輸出格式

for (auto &item : output_info) {

auto output_data = item.second;

output_data->setPrecision(Precision::FP32);

}

加載可執(zhí)行網(wǎng)絡(luò),創(chuàng)建推理請(qǐng)求對(duì)象實(shí)例,代碼如下:

// 創(chuàng)建可執(zhí)行網(wǎng)絡(luò)對(duì)象

auto executable_network = ie.LoadNetwork(network, "CPU");

// 請(qǐng)求推斷圖

auto infer_request = executable_network.CreateInferRequest();

設(shè)置推理輸入圖像數(shù)據(jù),轉(zhuǎn)換為NCHW格式的blob數(shù)據(jù),代碼如下:

/** Getting input blob **/

auto input = infer_request.GetBlob(input_name);

size_t num_channels = input->getTensorDesc().getDims()[1];

size_t h = input->getTensorDesc().getDims()[2];

size_t w = input->getTensorDesc().getDims()[3];

size_t image_size = h*w;

Mat blob_image;

resize(src, blob_image, Size(w, h));

// NCHW

unsigned char* data = static_cast(input->buffer());

for (size_t row = 0; row < h; row++) {

for (size_t col = 0; col < w; col++) {

for (size_t ch = 0; ch < num_channels; ch++) {

data[image_size*ch + row*w + col] = blob_image.at(row, col)[ch];

}

}

}

預(yù)測(cè)與解析輸出結(jié)果,代碼如下:

// 執(zhí)行預(yù)測(cè)

infer_request.Infer();

// 處理輸出結(jié)果

for (auto &item : output_info) {

auto output_name = item.first;

// 獲取輸出數(shù)據(jù)

auto output = infer_request.GetBlob(output_name);

const float* detection = static_cast::value_type*>(output->buffer());

const SizeVector outputDims = output->getTensorDesc().getDims();

const int maxProposalCount = outputDims[2];

const int objectSize = outputDims[3];

// 解析輸出結(jié)果

for (int curProposal = 0; curProposal < maxProposalCount; curProposal++) {

float label = detection[curProposal * objectSize + 1];

float confidence = detection[curProposal * objectSize + 2];

float xmin = detection[curProposal * objectSize + 3] * image_width;

float ymin = detection[curProposal * objectSize + 4] * image_height;

float xmax = detection[curProposal * objectSize + 5] * image_width;

float ymax = detection[curProposal * objectSize + 6] * image_height;

if (confidence > 0.5) {

printf("label id : %d ", static_cast(label));

Rect rect;

rect.x = static_cast(xmin);

rect.y = static_cast(ymin);

rect.width = static_cast(xmax - xmin);

rect.height = static_cast(ymax - ymin);

putText(src, "OpenVINO-2021R02", Point(20, 20), FONT_HERSHEY_SIMPLEX, 0.75, Scalar(0, 0, 255), 2, 8);

rectangle(src, rect, Scalar(0, 255, 255), 2, 8, 0);

}

std::cout << std::endl;

}

}

imshow("OpenVINO+SSD人臉檢測(cè)", src);

最終顯示結(jié)果如下:

圖-5

總結(jié)

本文我們完成了OpenVINO 人臉檢測(cè)模型的推理調(diào)用演示,關(guān)鍵知識(shí)點(diǎn)在于模型的輸入與輸出格式,以及推理以后的模型輸出數(shù)據(jù)的解析方式。到這里大家希望借助OpenVINO 實(shí)現(xiàn)一個(gè)視頻版本的人臉檢測(cè),沒關(guān)系,下一次我們將來完成這樣的事情……

編輯:jq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • SSD
    SSD
    +關(guān)注

    關(guān)注

    21

    文章

    2863

    瀏覽量

    117459
  • 代碼
    +關(guān)注

    關(guān)注

    30

    文章

    4790

    瀏覽量

    68654
  • 人臉檢測(cè)
    +關(guān)注

    關(guān)注

    0

    文章

    80

    瀏覽量

    16464
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5503

    瀏覽量

    121206
  • resnet
    +關(guān)注

    關(guān)注

    0

    文章

    12

    瀏覽量

    3171

原文標(biāo)題:OpenVINO? + SSD 實(shí)時(shí)對(duì)象檢測(cè)

文章出處:【微信號(hào):英特爾物聯(lián)網(wǎng),微信公眾號(hào):英特爾物聯(lián)網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    使用OpenVINO? ElectronJS中創(chuàng)建桌面應(yīng)用程序

    ? 最近,我完成了一個(gè) demo 演示,展示了 OpenVINO 在 Node.js 框架中的強(qiáng)大功能。得益于與 Electron.js 的集成,該演示不僅能夠高效地執(zhí)行神經(jīng)網(wǎng)絡(luò)推理,還提供了交互式
    的頭像 發(fā)表于 11-25 11:35 ?184次閱讀
    使用<b class='flag-5'>OpenVINO</b>? ElectronJS中創(chuàng)建桌面應(yīng)用程序

    使用OpenVINO C# API部署YOLO-World實(shí)現(xiàn)實(shí)時(shí)開放詞匯對(duì)象檢測(cè)

    的快速準(zhǔn)確識(shí)別,并通過AR技術(shù)將虛擬元素與真實(shí)場(chǎng)景相結(jié)合,為用戶帶來沉浸式的交互體驗(yàn)。在本文中,我們將結(jié)合OpenVINO C# API使用最新發(fā)布的OpenVINO 2024.0部署 YOLO-World實(shí)現(xiàn)實(shí)時(shí)開放詞匯
    的頭像 發(fā)表于 08-30 16:27 ?667次閱讀
    使用<b class='flag-5'>OpenVINO</b> C# API部署YOLO-World實(shí)現(xiàn)<b class='flag-5'>實(shí)時(shí)</b>開放詞匯<b class='flag-5'>對(duì)象</b><b class='flag-5'>檢測(cè)</b>

    HDD和SSD的區(qū)別有哪些

    HDD(Hard Disk Drive,硬盤驅(qū)動(dòng)器)和SSD(Solid State Drive,固態(tài)硬盤)是計(jì)算機(jī)存儲(chǔ)系統(tǒng)中兩種主要的存儲(chǔ)設(shè)備,它們?cè)诮Y(jié)構(gòu)、性能、應(yīng)用場(chǎng)景等方面存在顯著差異。以下是對(duì)HDD和SSD的詳細(xì)解析。
    的頭像 發(fā)表于 08-30 14:35 ?1188次閱讀

    OpenVINO2024 C++推理使用技巧

    很多人都使用OpenVINO新版的C++ 或者Python的SDK,都覺得非常好用,OpenVINO2022之后的版本C++ SDK做了大量的優(yōu)化與整理,已經(jīng)是非常貼近開發(fā)的使用習(xí)慣與推理方式。與OpenCV的Mat對(duì)象對(duì)接方式
    的頭像 發(fā)表于 07-26 09:20 ?934次閱讀

    深入解析:汽車水箱氣密性檢測(cè)儀的工作原理與優(yōu)勢(shì)

    在汽車制造與檢測(cè)領(lǐng)域,水箱氣密性檢測(cè)儀發(fā)揮著至關(guān)重要的作用。它是確保汽車水箱在各種工況下都能保持優(yōu)良密閉性能的關(guān)鍵工具。本文將深入解析汽車水箱氣密性檢測(cè)儀的工作原理及其顯著優(yōu)勢(shì)。一、工
    的頭像 發(fā)表于 07-23 13:37 ?268次閱讀
    深入<b class='flag-5'>解析</b>:汽車水箱氣密性<b class='flag-5'>檢測(cè)</b>儀的工作原理與優(yōu)勢(shì)

    OpenVINO C# API在intel平臺(tái)部署YOLOv10目標(biāo)檢測(cè)模型

    的模型設(shè)計(jì)策略,從效率和精度兩個(gè)角度對(duì)YOLOs的各個(gè)組成部分進(jìn)行了全面優(yōu)化,大大降低了計(jì)算開銷,增強(qiáng)了性能。在本文中,我們將結(jié)合OpenVINO C# API使用最新發(fā)布的OpenVINO 2024.1部署YOLOv10目標(biāo)檢測(cè)
    的頭像 發(fā)表于 06-21 09:23 ?1045次閱讀
    用<b class='flag-5'>OpenVINO</b> C# API在intel平臺(tái)部署YOLOv10目標(biāo)<b class='flag-5'>檢測(cè)</b>模型

    聊聊下一代企業(yè)級(jí)SSD外形EDSFF #EDSFF #SSD #硬盤抽取盒

    硬盤SSD
    ICY DOCK硬盤盒
    發(fā)布于 :2024年06月13日 17:15:19

    OpenVINO? Java API應(yīng)用RT-DETR做目標(biāo)檢測(cè)器實(shí)戰(zhàn)

    本文將從零開始詳細(xì)介紹環(huán)境搭建的完整步驟,我們基于英特爾開發(fā)套件AIxBoard為硬件基礎(chǔ)實(shí)現(xiàn)了Java在Ubuntu 22.04系統(tǒng)上成功使用OpenVINO? Java API,并且成功運(yùn)行了RT-DETR實(shí)現(xiàn)實(shí)時(shí)端到端目標(biāo)檢測(cè)
    的頭像 發(fā)表于 03-18 15:04 ?819次閱讀
    <b class='flag-5'>OpenVINO</b>? Java API應(yīng)用RT-DETR做目標(biāo)<b class='flag-5'>檢測(cè)</b>器實(shí)戰(zhàn)

    機(jī)器視覺應(yīng)用尺寸檢測(cè)基礎(chǔ)解析

    利用邊緣檢查的尺寸檢查是圖像傳感器的最新應(yīng)用趨勢(shì)。圖像傳感器可以將檢查對(duì)象在平面上表現(xiàn)出來,通過邊緣檢測(cè),測(cè)算位置、寬度、角度等。
    發(fā)表于 03-12 13:53 ?796次閱讀
    機(jī)器視覺應(yīng)用尺寸<b class='flag-5'>檢測(cè)</b>基礎(chǔ)<b class='flag-5'>解析</b>

    OpenCV4.8 C++實(shí)現(xiàn)YOLOv8 OBB旋轉(zhuǎn)對(duì)象檢測(cè)

    YOLOv8框架在在支持分類、對(duì)象檢測(cè)、實(shí)例分割、姿態(tài)評(píng)估的基礎(chǔ)上更近一步,現(xiàn)已經(jīng)支持旋轉(zhuǎn)對(duì)象檢測(cè)(OBB),基于DOTA數(shù)據(jù)集,支持航拍圖像的15個(gè)類別
    的頭像 發(fā)表于 02-22 10:15 ?1689次閱讀
    OpenCV4.8 C++實(shí)現(xiàn)YOLOv8 OBB旋轉(zhuǎn)<b class='flag-5'>對(duì)象</b><b class='flag-5'>檢測(cè)</b>

    對(duì)象檢測(cè)邊界框損失函數(shù)–從IOU到ProbIOU介紹

    目標(biāo)檢測(cè)損失函數(shù)的選擇在目標(biāo)檢測(cè)問題建模中至關(guān)重要。通常,目標(biāo)檢測(cè)需要兩個(gè)損失函數(shù),一個(gè)用于對(duì)象分類,另一個(gè)用于邊界框回歸(BBR)。
    的頭像 發(fā)表于 01-24 10:50 ?2890次閱讀
    <b class='flag-5'>對(duì)象</b><b class='flag-5'>檢測(cè)</b>邊界框損失函數(shù)–從IOU到ProbIOU介紹

    OpenVINO添加對(duì)Paddle 2.5的支持

    我是飛槳黑客馬拉松第五期 OpenVINO 賽題獲獎(jiǎng)?wù)摺獮?OpenVINO 添加了對(duì) Paddle 2.5 的支持。在此記錄下來貢獻(xiàn)的過程,希望有更多的同學(xué)可以參與到 OpenVINO 的社區(qū)
    的頭像 發(fā)表于 01-19 09:20 ?644次閱讀

    基于OpenVINO?和AIxBoard的智能安檢盒子設(shè)計(jì)

    公共安全問題日益凸顯,傳統(tǒng)安檢手段面臨挑戰(zhàn)。為提高安檢效率和保障公共安全,基于 OpenVINO? 和 AIxBoard 的智能安檢盒子應(yīng)運(yùn)而生。
    的頭像 發(fā)表于 01-18 17:31 ?828次閱讀
    基于<b class='flag-5'>OpenVINO</b>?和AIxBoard的智能安檢盒子設(shè)計(jì)

    如何在MacOS上編譯OpenVINO C++項(xiàng)目呢?

    英特爾公司發(fā)行的模型部署工具 OpenVINO 模型部署套件,可以實(shí)現(xiàn)在不同系統(tǒng)環(huán)境下運(yùn)行,且發(fā)布的 OpenVINO 2023 最新版目前已經(jīng)支持 MacOS 系統(tǒng)并同時(shí)支持在蘋果 M 系列芯片上部署模型。
    的頭像 發(fā)表于 01-11 18:07 ?910次閱讀
    如何在MacOS上編譯<b class='flag-5'>OpenVINO</b> C++項(xiàng)目呢?

    YOLOv8實(shí)現(xiàn)旋轉(zhuǎn)對(duì)象檢測(cè)

    YOLOv8框架在在支持分類、對(duì)象檢測(cè)、實(shí)例分割、姿態(tài)評(píng)估的基礎(chǔ)上更近一步,現(xiàn)已經(jīng)支持旋轉(zhuǎn)對(duì)象檢測(cè)(OBB),基于DOTA數(shù)據(jù)集,支持航拍圖像的15個(gè)類別
    的頭像 發(fā)表于 01-11 10:43 ?1856次閱讀
    YOLOv8實(shí)現(xiàn)旋轉(zhuǎn)<b class='flag-5'>對(duì)象</b><b class='flag-5'>檢測(cè)</b>