0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

通過利用深度學習對道路損壞進行檢測分析

新機器視覺 ? 來源:小白學視覺 ? 作者:小白學視覺 ? 2022-07-06 09:35 ? 次閱讀

1.簡介

道路基礎設施是一項重要的公共資產(chǎn),因為它有助于經(jīng)濟發(fā)展和增長,同時帶來重要的社會效益。路面檢查主要基于人類的視覺觀察和使用昂貴機器的定量分析。這些方法的最佳替代方案是智能探測器,它使用記錄的圖像或視頻檢測損壞情況。除了道路INFR一個結構,道路破損檢測器也將在自主駕駛汽車,以檢測他們的方式有些坑洼或其他干擾,盡量避免他們有用。

2.數(shù)據(jù)集

本項目中使用的數(shù)據(jù)集是從這里收集的。該數(shù)據(jù)集包含不同國家的道路圖像,它們是日本、印度、捷克。對于圖像,標簽的注釋是在 xml 文件中,即標簽是 PASCAL VOC 格式。由于數(shù)據(jù)集包含來自日本的大部分圖像(在以前的版本中,它僅包含來自日本的圖像),因此根據(jù)數(shù)據(jù)來源,根據(jù)日本道路指南確定了標簽。

但是最新的數(shù)據(jù)集現(xiàn)在包含其他國家的圖像,因此為了概括我們只考慮以下標簽的損害。D00:垂直裂縫,D10:水平裂縫,D20:鱷魚裂縫,D40:坑洼

3.基于深度學習得目標檢測

CNN 或卷積神經(jīng)網(wǎng)絡是所有計算機視覺任務的基石。即使在物體檢測的情況下,從圖像中提取物體的模式到特征圖(基本上是一個比圖像尺寸小的矩陣)卷積操作也被使用。現(xiàn)在從過去幾年開始,已經(jīng)對對象檢測任務進行了大量研究,我們得到了大量最先進的算法或方法,其中一些簡而言之,我們在下面進行了解釋。

4.EDA

數(shù)據(jù)集中的圖像總數(shù):26620

標簽分布

每個班級的計數(shù)D00 : 6592 D10 : 4446 D20 : 8381 D40 : 5627

各國標簽分布(全數(shù)據(jù)分析)

捷克數(shù)據(jù)分析0 圖像數(shù)量 2829 1 D00 988 2 D10 399 3 D20 161 4 D40 197 5 標簽數(shù)量 1745 ************************ **********************************************印度數(shù)據(jù)分析 類別計數(shù)6 圖像數(shù)量 7706 7 D00 1555 8 D10 68 9 D20 2021 10 D40 3187 11 標簽數(shù)量 6831 **************************** ******************************************日本數(shù)據(jù)分析12 圖像數(shù)量 10506 13 D00 404914 D10 3979 15 D20 6199 16 D40 2243 17 標簽數(shù)量 16470 ************************************ ************************************

圖像中標簽大小的分布

標簽最小尺寸:0x1 標簽最大尺寸:704x492

5.關鍵技術

對象檢測現(xiàn)在是一個龐大的主題,相當于一個學期的主題。它由許多算法組成。因此,為了使其簡短,目標檢測算法被分為各種類別,例如基于區(qū)域的算法(RCNN、Fast-RCNN、Faster-RCNN)、兩級檢測器、一級檢測器,其中基于區(qū)域的算法本身是兩級檢測器的一部分,但我們將在下面簡要地解釋它們,因此我們明確地提到了它們。讓我們從RCNN(基于區(qū)域的卷積神經(jīng)網(wǎng)絡)開始。

目標檢測算法的基本架構由兩部分組成。該部分由一個 CNN 組成,它將原始圖像信息轉(zhuǎn)換為特征圖,在下一部分中,不同的算法有不同的技術。因此,在 RCNN 的情況下,它使用選擇性搜索來獲得 ROI(感興趣區(qū)域),即在那個地方有可能有不同的對象。從每個圖像中提取大約 2000 個區(qū)域。它使用這些 ROI 對標簽進行分類并使用兩種不同的模型預測對象位置。因此這些模型被稱為兩級檢測器。

RCNN 有一些限制,為了克服這些限制,他們提出了 Fast RCNN。RCNN 具有很高的計算時間,因為每個區(qū)域都分別傳遞給 CNN,并且它使用三種不同的模型進行預測。因此,在 Fast RCNN 中,每個圖像只傳遞一次到 CNN 并提取特征圖。在這些地圖上使用選擇性搜索來生成預測。將 RCNN 中使用的所有三個模型組合在一起。

但是 Fast RCNN 仍然使用緩慢的選擇性搜索,因此計算時間仍然很長。猜猜他們想出了另一個名字有意義的版本,即更快的 RCNN。Faster RCNN 用區(qū)域提議網(wǎng)絡代替了選擇性搜索方法,使算法更快?,F(xiàn)在讓我們轉(zhuǎn)向一些一次性檢測器。YOLO 和 SSD 是非常著名的物體檢測模型,因為它們在速度和準確性之間提供了非常好的權衡

YOLO:單個神經(jīng)網(wǎng)絡在一次評估中直接從完整圖像中預測邊界框和類別概率。由于整個檢測管道是一個單一的網(wǎng)絡,因此可以直接在檢測性能上進行端到端的優(yōu)化

SSD(Single Shot Detector):SSD 方法將邊界框的輸出空間離散為一組不同縱橫比的默認框。離散化后,該方法按特征圖位置進行縮放。Single Shot Detector 網(wǎng)絡結合了來自具有不同分辨率的多個特征圖的預測,以自然地處理各種大小的對象。

6.型號

作為深度學習的新手,或者準確地說是計算機視覺,為了學習基礎知識,我們嘗試了一些基本且快速的算法來實現(xiàn)如下數(shù)據(jù)集:

Efficientdet_d0SSD_mobilenet_v2YOLOv3

對于第一個和第二個模型,我們使用了tensorflow 模型 zoo并且為了訓練 yolov3 引用了this。用于評估 mAP(平均平均精度),使用 Effectivedet_d0 和 ssd_mobilenet_v2 得到的 mAP 非常低,可能是因為沒有更改學習率、優(yōu)化器和數(shù)據(jù)增強的一些默認配置。

7.結果

使用 efficicentdet_d0 進行推導

import tensorflow as tffrom object_detection.utils import label_map_utilfrom object_detection.utils import config_utilfrom object_detection.utils import visualization_utils as viz_utilsfrom object_detection.builders import model_builder# Load pipeline config and build a detection modelconfigs = config_util.get_configs_from_pipeline_file('/content/efficientdet_d0_coco17_tpu-32/pipeline.config')model_config = configs['model']detection_model = model_builder.build(model_config=model_config, is_training=False)# Restore checkpointckpt = tf.compat.v2.train.Checkpoint(model=detection_model)ckpt.restore('/content/drive/MyDrive/efficientdet/checkpoints/ckpt-104').expect_partial()@tf.functiondef detect_fn(image):"""Detect objects in image."""    image, shapes = detection_model.preprocess(image)    prediction_dict = detection_model.predict(image, shapes)    detections = detection_model.postprocess(prediction_dict, shapes)return detectionscategory_index = label_map_util.create_category_index_from_labelmap('/content/data/label_map.pbtxt',                                                                    use_display_name=True)for image_path in IMAGE_PATHS:    print('Running inference for {}... '.format(image_path), end='')    image_np = load_image_into_numpy_array(image_path)    input_tensor = tf.convert_to_tensor(np.expand_dims(image_np, 0), dtype=tf.float32)    detections = detect_fn(input_tensor)    num_detections = int(detections.pop('num_detections'))    detections = {key: value[0, :num_detections].numpy()for key, value in detections.items()}    detections['num_detections'] = num_detections# detection_classes should be ints.    detections['detection_classes'] = detections['detection_classes'].astype(np.int64)    label_id_offset = 1    image_np_with_detections = image_np.copy()    viz_utils.visualize_boxes_and_labels_on_image_array(            image_np_with_detections,            detections['detection_boxes'],            detections['detection_classes']+label_id_offset,            detections['detection_scores'],            category_index,            use_normalized_coordinates=True,            max_boxes_to_draw=200,            min_score_thresh=.30,            agnostic_mode=False)    %matplotlib inline    fig = plt.figure(figsize = (10,10))    plt.imshow(image_np_with_detections)    print('Done')    plt.show()

使用 SSD_mobilenet_v2 進行推導

(與efficientdet 相同的代碼)

YOLOv3 的推導

def func(input_file):classes = ['D00', 'D10', 'D20', 'D40']alt_names = {'D00': 'lateral_crack', 'D10': 'linear_cracks', 'D20': 'aligator_crakcs', 'D40': 'potholes'}  # initialize a list of colors to represent each possible class labelnp.random.seed(42)COLORS = np.random.randint(0, 255, size=(len(classes), 3),dtype="uint8")  # derive the paths to the YOLO weights and model configurationweightsPath = "/content/drive/MyDrive/yolo/yolo-obj_final.weights"configPath = "/content/yolov3.cfg"  # load our YOLO object detector trained on COCO dataset (80 classes)  # and determine only the *output* layer names that we need from YOLO  #print("[INFO] loading YOLO from disk...")net = cv2.dnn.readNetFromDarknet(configPath, weightsPath)ln = net.getLayerNames()ln = [ln[i[0] - 1] for i in net.getUnconnectedOutLayers()]  # read the next frame from the fileframe = cv2.imread(input_file)(H, W) = frame.shape[:2]  # construct a blob from the input frame and then perform a forward  # pass of the YOLO object detector, giving us our bounding boxes  # and associated probabilitiesblob = cv2.dnn.blobFromImage(frame, 1 / 255.0, (416, 416),swapRB=True, crop=False)net.setInput(blob)start = time.time()layerOutputs = net.forward(ln)end = time.time()  # initialize our lists of detected bounding boxes, confidences,  # and class IDs, respectivelyboxes = []confidences = []classIDs = []  # loop over each of the layer outputsfor output in layerOutputs:    # loop over each of the detectionsfor detection in output:      # extract the class ID and confidence (i.e., probability)      # of the current object detectionscores = detection[5:]classID = np.argmax(scores)confidence = scores[classID]      # filter out weak predictions by ensuring the detected      # probability is greater than the minimum probabilityif confidence > 0.3:        # scale the bounding box coordinates back relative to        # the size of the image, keeping in mind that YOLO        # actually returns the center (x, y)-coordinates of        # the bounding box followed by the boxes' width and        # heightbox = detection[0:4] * np.array([W, H, W, H])(centerX, centerY, width, height) = box.astype("int")        # use the center (x, y)-coordinates to derive the top        # and and left corner of the bounding boxx = int(centerX - (width / 2))y = int(centerY - (height / 2))        # update our list of bounding box coordinates,        # confidences, and class IDsboxes.append([x, y, int(width), int(height)])confidences.append(float(confidence))classIDs.append(classID)  # apply non-maxima suppression to suppress weak, overlapping  # bounding boxesidxs = cv2.dnn.NMSBoxes(boxes, confidences, 0.3,0.25)  # ensure at least one detection existsif len(idxs) > 0:    # loop over the indexes we are keepingfor i in idxs.flatten():      # extract the bounding box coordinates(x, y) = (boxes[i][0], boxes[i][1])(w, h) = (boxes[i][2], boxes[i][3])      # draw a bounding box rectangle and label on the framecolor = [int(c) for c in COLORS[classIDs[i]]]cv2.rectangle(frame, (x, y), (x + w, y + h), color, 2)label = classes[classIDs[i]]text = "{}: {:.4f}".format(alt_names[label],confidences[i])cv2.putText(frame, text, (x, y - 5),cv2.FONT_HERSHEY_SIMPLEX, 0.5, color, 2)  cv2_imshow(frame)
審核編輯:郭婷
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 檢測器
    +關注

    關注

    1

    文章

    865

    瀏覽量

    47714
  • 計算機
    +關注

    關注

    19

    文章

    7512

    瀏覽量

    88155
  • 深度學習
    +關注

    關注

    73

    文章

    5505

    瀏覽量

    121255

原文標題:實戰(zhàn):基于深度學習的道路損壞檢測

文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關推薦

    GPU深度學習應用案例

    GPU在深度學習中的應用廣泛且重要,以下是一些GPU深度學習應用案例: 一、圖像識別 圖像識別是深度學習
    的頭像 發(fā)表于 10-27 11:13 ?408次閱讀

    AI大模型與深度學習的關系

    AI大模型與深度學習之間存在著密不可分的關系,它們互為促進,相輔相成。以下是對兩者關系的介紹: 一、深度學習是AI大模型的基礎 技術支撐 :深度
    的頭像 發(fā)表于 10-23 15:25 ?879次閱讀

    FPGA做深度學習能走多遠?

    的發(fā)展前景較為廣闊,但也面臨一些挑戰(zhàn)。以下是一些關于 FPGA 在深度學習中應用前景的觀點,僅供參考: ? 優(yōu)勢方面: ? 高度定制化的計算架構:FPGA 可以根據(jù)深度學習算法的特殊需
    發(fā)表于 09-27 20:53

    深度識別算法包括哪些內(nèi)容

    :CNN是深度學習中處理圖像和視頻等具有網(wǎng)格結構數(shù)據(jù)的主要算法。它通過卷積層、池化層和全連接層等組件,實現(xiàn)對圖像特征的自動提取和識別。 應用領域 :CNN在圖像識別、目標檢測、視頻
    的頭像 發(fā)表于 09-10 15:28 ?400次閱讀

    深度學習中的無監(jiān)督學習方法綜述

    深度學習作為機器學習領域的一個重要分支,近年來在多個領域取得了顯著的成果,特別是在圖像識別、語音識別、自然語言處理等領域。然而,深度學習模型
    的頭像 發(fā)表于 07-09 10:50 ?802次閱讀

    深度學習在工業(yè)機器視覺檢測中的應用

    隨著深度學習技術的快速發(fā)展,其在工業(yè)機器視覺檢測中的應用日益廣泛,并展現(xiàn)出巨大的潛力。工業(yè)機器視覺檢測是工業(yè)自動化領域的重要組成部分,通過
    的頭像 發(fā)表于 07-08 10:40 ?1096次閱讀

    基于AI深度學習的缺陷檢測系統(tǒng)

    在工業(yè)生產(chǎn)中,缺陷檢測是確保產(chǎn)品質(zhì)量的關鍵環(huán)節(jié)。傳統(tǒng)的人工檢測方法不僅效率低下,且易受人為因素影響,導致誤檢和漏檢問題頻發(fā)。隨著人工智能技術的飛速發(fā)展,特別是深度學習技術的崛起,基于A
    的頭像 發(fā)表于 07-08 10:30 ?1498次閱讀

    深度學習在視覺檢測中的應用

    深度學習是機器學習領域中的一個重要分支,其核心在于通過構建具有多層次的神經(jīng)網(wǎng)絡模型,使計算機能夠從大量數(shù)據(jù)中自動學習并提取特征,進而實現(xiàn)對復
    的頭像 發(fā)表于 07-08 10:27 ?750次閱讀

    基于深度學習的小目標檢測

    在計算機視覺領域,目標檢測一直是研究的熱點和難點之一。特別是在小目標檢測方面,由于小目標在圖像中所占比例小、特征不明顯,使得檢測難度顯著增加。隨著深度
    的頭像 發(fā)表于 07-04 17:25 ?928次閱讀

    深度學習常用的Python庫

    深度學習作為人工智能的一個重要分支,通過模擬人類大腦中的神經(jīng)網(wǎng)絡來解決復雜問題。Python作為一種流行的編程語言,憑借其簡潔的語法和豐富的庫支持,成為了深度
    的頭像 發(fā)表于 07-03 16:04 ?663次閱讀

    深度學習與傳統(tǒng)機器學習的對比

    在人工智能的浪潮中,機器學習深度學習無疑是兩大核心驅(qū)動力。它們各自以其獨特的方式推動著技術的進步,為眾多領域帶來了革命性的變化。然而,盡管它們都屬于機器學習的范疇,但
    的頭像 發(fā)表于 07-01 11:40 ?1422次閱讀

    深度學習檢測小目標常用方法

    深度學習的效果在某種意義上是靠大量數(shù)據(jù)喂出來的,小目標檢測的性能同樣也可以通過增加訓練集中小目標樣本的種類和數(shù)量來提升。
    發(fā)表于 03-18 09:57 ?734次閱讀
    <b class='flag-5'>深度</b><b class='flag-5'>學習</b><b class='flag-5'>檢測</b>小目標常用方法

    基于深度學習的芯片缺陷檢測梳理分析

    雖然表面缺陷檢測技術已經(jīng)不斷從學術研究走向成熟的工業(yè)應用,但是依然有一些需要解決的問題?;谝陨?b class='flag-5'>分析可以發(fā)現(xiàn),由于芯片表面缺陷的獨特性質(zhì),通用目標檢測算法不適合直接應用于芯片表面缺陷檢測
    發(fā)表于 02-25 14:30 ?1566次閱讀
    基于<b class='flag-5'>深度</b><b class='flag-5'>學習</b>的芯片缺陷<b class='flag-5'>檢測</b>梳理<b class='flag-5'>分析</b>

    基于機器視覺和深度學習的焊接質(zhì)量檢測系統(tǒng)

    的一致性和準確性。 ? 機器視覺技術為焊接質(zhì)量檢測提供了高分辨率的圖像數(shù)據(jù)。通過搭載高速、高分辨率相機,系統(tǒng)能夠?qū)崟r捕捉焊接過程中的細節(jié),包括焊縫的形狀、尺寸和表面特征等。這些圖像數(shù)據(jù)為后續(xù)的深度
    的頭像 發(fā)表于 01-18 17:50 ?826次閱讀

    利用手持攝像機圖像通過卷積神經(jīng)網(wǎng)絡實時進行水稻檢測

    在本研究中,研究者提出了一種有效的深度卷積神經(jīng)網(wǎng)絡(DCNN)結構,利用手持照相機拍攝的照片來檢測水稻的生長階段(DVS)。
    的頭像 發(fā)表于 01-09 10:10 ?508次閱讀
    <b class='flag-5'>利用</b>手持攝像機圖像<b class='flag-5'>通過</b>卷積神經(jīng)網(wǎng)絡實時<b class='flag-5'>進行</b>水稻<b class='flag-5'>檢測</b>