1哪吒套件簡介
英特爾的哪吒(Nezha)開發(fā)套件是一款專為邊緣AI和物聯(lián)網(wǎng)應(yīng)用設(shè)計的高性能計算平臺,搭載了英特爾 N97處理器、內(nèi)置英特爾 UHD Graphics GPU,并提供高達(dá)8GB LPDDR5內(nèi)存與32GB至64GB eMMC存儲選項(xiàng)。它支持Windows和Linux操作系統(tǒng),具備豐富的接口如千兆以太網(wǎng)、HDMI 1.4、USB 3.0/2.0以及GPIO等,兼容樹莓派擴(kuò)展板。此外,該套件采用無風(fēng)扇設(shè)計并集成了TPM 2.0安全模塊,適用于自動化、物聯(lián)網(wǎng)網(wǎng)關(guān)、數(shù)字標(biāo)牌及機(jī)器人等多種場景,結(jié)合OpenVINO 工具包可加速深度學(xué)習(xí)模型推理,便于開發(fā)者快速構(gòu)建高效且安全的解決方案。
2YOLOv5簡介
YOLOv5是YOLO(You Only Look Once)系列中的一種實(shí)時對象檢測系統(tǒng),它以速度快、準(zhǔn)確性高而聞名。對于開發(fā)者來說,YOLOv5提供了一種簡單易用的方法來創(chuàng)建高效的對象檢測模型。官方GitHub倉庫提供了豐富的資源和示例代碼,可以幫助用戶快速入門并開始構(gòu)建自己的檢測器。
3哪吒套件部署YOLOv5
YOLOv5以其出色的實(shí)時性能和高準(zhǔn)確性而受到廣泛歡迎,并且官方提供了詳盡的文檔和支持,與其他設(shè)備相同,在哪吒套件上部署YOLOv5進(jìn)行透明物體目標(biāo)檢測時,用戶仍需注意一些關(guān)鍵步驟。首先,確保開發(fā)環(huán)境已正確配置,包括安裝所有必要的依賴項(xiàng)如Python、PyTorch等。接著,準(zhǔn)備訓(xùn)練數(shù)據(jù)集是至關(guān)重要的一步,這通常涉及將圖像及其標(biāo)注信息按照特定格式整理好。對于透明物體檢測這樣的特定任務(wù),可能還需要對模型做一些微調(diào)以優(yōu)化其識別能力。整個過程雖然需要一定的技術(shù)背景支持,但借助于豐富的在線資源和社區(qū)幫助,即使是初次嘗試者也能順利完成部署。下面的步驟可以讓你在搭載在哪吒套件的windows平臺快速上手訓(xùn)練自己的模型。
4搭配環(huán)境與安裝依賴
在win+R中打開cmd,輸入以下代碼創(chuàng)建并進(jìn)入一個名為yolov5s, python3.8版本的虛擬環(huán)境。
conda create -n yolov5s python=3.8 conda activate yolov5s
克隆倉庫:從官方GitHub倉庫克隆YOLOv5項(xiàng)目到本地機(jī)器。
git clone https://github.com/ultralytics/yolov5 cd yolov5
然后輸入以下代碼,即可自動下載安裝所有需要的庫。
pip install -r requirements.txt
如果下載速度過慢,可能會導(dǎo)致報錯,可以復(fù)制下面代碼(清華源)到cmd中運(yùn)行,然后在重新進(jìn)行上面下載庫的步驟。
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/ conda config --ad conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge/ conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/msys2/ conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/bioconda/ conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/menpo/ conda config --set show_channel_urls yes
5Trans10k數(shù)據(jù)集準(zhǔn)備
5.1數(shù)據(jù)集下載
Trans10K是一個公開的大規(guī)模透明物體分割數(shù)據(jù)集,包含10,428張真實(shí)場景圖像,每張都經(jīng)過手動標(biāo)注。它提供了多樣化的透明物體樣本,如杯子、瓶子和窗戶等。數(shù)據(jù)集分為訓(xùn)練(5,000張)、驗(yàn)證(1,000張)和測試(4,428張)三部分,并進(jìn)一步細(xì)分為簡單和困難類別,整個數(shù)據(jù)集大小約為10.6GB。
可以使用相應(yīng)的SDK進(jìn)行下載:
pip install openxlab #安裝 pip install -U openxlab #版本升級 import openxlab openxlab.login(ak=, sk= ) #進(jìn)行登錄,輸入對應(yīng)的AK/SK from openxlab.dataset import info info(dataset_repo='OpenDataLab/Trans10K') #數(shù)據(jù)集信息及文件列表查看 from openxlab.dataset import get get(dataset_repo='OpenDataLab/Trans10K', target_path='/path/to/local/folder/') # 數(shù)據(jù)集下載 from openxlab.dataset import download download(dataset_repo='OpenDataLab/Trans10K',source_path='/README.md', target_path='/path/to/local/folder') #數(shù)據(jù)集文件下載
下載后解壓即可。
5.2 格式化數(shù)據(jù)
Trans10K數(shù)據(jù)集通常包含圖像及其對應(yīng)的標(biāo)注文件。為了與YOLOv5兼容,您需要確保每個圖像都有一個對應(yīng)的.txt文件,其中包含目標(biāo)框的位置信息。格式如下:
class_index x_center y_center width height
所有坐標(biāo)都是相對于圖像尺寸的歸一化值(0.0到1.0之間)。然而Trans10K的標(biāo)注格式不是YOLO格式。
這就需要編寫一個腳本來將標(biāo)注轉(zhuǎn)換為YOLO格式。轉(zhuǎn)換腳本如下:
import cv2 import numpy as np import os from pathlib import Path path_to_masks = 'path/to/mask' path_to_save_yolo_labels = ' path/to/mask/label' def convert_mask_to_bbox(mask_path, save_path): # 創(chuàng)建保存路徑 Path(save_path).mkdir(parents=True, exist_ok=True) # 遍歷 mask 文件 for mask_file in os.listdir(mask_path): if mask_file.endswith(".png"): # mask 以 .png 格式保存 mask = cv2.imread(os.path.join(mask_path, mask_file), cv2.IMREAD_GRAYSCALE) contours, _ = cv2.findContours(mask, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE) # 獲取文件名,無擴(kuò)展名 filename = os.path.splitext(mask_file)[0] bbox_file = open(os.path.join(save_path, filename + ".txt"), 'w') for contour in contours: x, y, w, h = cv2.boundingRect(contour) # YOLO 格式:class x_center y_center width height (歸一化到[0,1]范圍) img_height, img_width = mask.shape x_center = (x + w / 2) / img_width y_center = (y + h / 2) / img_height width = w / img_width height = h / img_height # 假設(shè)所有目標(biāo)都是同一類 (class = 0) bbox_file.write(f"0 {x_center} {y_center} {width} {height} ") bbox_file.close() # 使用示例 convert_mask_to_bbox(path_to_masks, path_to_save_yolo_labels)
5.3 組織文件結(jié)構(gòu)
按照YOLOv5的要求組織文件結(jié)構(gòu)。需要以下目錄結(jié)構(gòu):
/path/to/dataset/
├──images/
│ ├──train/
│ └── val/
└── labels/
├──train/
└── val/
images/ 目錄下存放圖像文件。
labels/ 目錄下存放相應(yīng)的標(biāo)注文件(.txt)。
5.4配置data.yaml文件
編輯YOLOv5項(xiàng)目中的data.yaml文件或者新建一個trans10k_data.yaml,指定數(shù)據(jù)集路徑及類別信息,如下所示:
train: /path/to/dataset/images/train # 訓(xùn)練圖片路徑 val: /path/to/dataset/images/val # 驗(yàn)證圖片路徑 nc: 1 # 類別數(shù)量,假設(shè)只有一個類別 names: ['transparent_object'] # 類別名稱列表
6啟動訓(xùn)練
使用以下命令啟動訓(xùn)練過程,您可以根據(jù)硬件性能調(diào)整圖片大小(--img)、批量大小(--batch)等選項(xiàng)。
python train.py --img 640 --batch 16 --epochs 50 --data data/trans10k_data.yaml --cfg models/yolov5s.yaml --weights yolov5s.pt
訓(xùn)練完成后,就得到了一個能夠檢測透明目標(biāo)的模型。
7總結(jié)
通過遵循上述步驟,即使是初學(xué)者也能迅速掌握YOLOv5的訓(xùn)練方法并在英特爾的哪吒(Nezha)開發(fā)套件上成功運(yùn)行。哪吒套件憑借其高性能的英特爾N97處理器、內(nèi)置的英特爾 UHD Graphics GPU以及高達(dá)8GB的LPDDR5內(nèi)存,為實(shí)時目標(biāo)檢測提供了強(qiáng)大的計算支持。
借助YOLOv5的強(qiáng)大功能以及個性化的Trans10K數(shù)據(jù)集,用戶能夠快速開發(fā)出針對透明物體的高度精確的對象檢測模型。哪吒套件的無風(fēng)扇設(shè)計和豐富的接口選項(xiàng)比如千兆以太網(wǎng)、HDMI 1.4、USB 3.0/2.0等,使其非常適合部署在各種邊緣計算環(huán)境中,無論是智能監(jiān)控、工業(yè)自動化還是其他物聯(lián)網(wǎng)應(yīng)用,都能提供可靠且高效的解決方案。
-
英特爾
+關(guān)注
關(guān)注
61文章
9992瀏覽量
172009 -
開發(fā)板
+關(guān)注
關(guān)注
25文章
5087瀏覽量
97785 -
目標(biāo)檢測
+關(guān)注
關(guān)注
0文章
209瀏覽量
15638 -
開發(fā)套件
+關(guān)注
關(guān)注
2文章
155瀏覽量
24293
原文標(biāo)題:開發(fā)者實(shí)戰(zhàn)|英特爾開發(fā)板 - 哪吒套件部署YOLOv5:完成透明物體目標(biāo)檢測
文章出處:【微信號:英特爾物聯(lián)網(wǎng),微信公眾號:英特爾物聯(lián)網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論