0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

半監(jiān)督學(xué)習(xí):比監(jiān)督學(xué)習(xí)做的更好

電子設(shè)計(jì) ? 來源:電子設(shè)計(jì) ? 作者:電子設(shè)計(jì) ? 2020-12-08 23:32 ? 次閱讀
首發(fā):AI公園公眾號
作者:Andre Ye
編譯:ronghuaiyang

導(dǎo)讀

為什么半監(jiān)督學(xué)習(xí)是機(jī)器學(xué)習(xí)的未來。


監(jiān)督學(xué)習(xí)是人工智能領(lǐng)域的第一種學(xué)習(xí)類型。從它的概念開始,無數(shù)的算法,從簡單的邏輯回歸到大規(guī)模的神經(jīng)網(wǎng)絡(luò),都已經(jīng)被研究用來提高精確度和預(yù)測能力。
然而,一個(gè)重大突破揭示了添加“無監(jiān)督數(shù)據(jù)”可以提高模型泛化和性能。事實(shí)上,在非常多的場景中,帶有標(biāo)簽的數(shù)據(jù)并不容易獲得。半監(jiān)督學(xué)習(xí)可以在標(biāo)準(zhǔn)的任務(wù)中實(shí)現(xiàn)SOTA的效果,只需要一小部分的有標(biāo)記數(shù)據(jù) —— 數(shù)百個(gè)訓(xùn)練樣本。
在這個(gè)我們對半監(jiān)督學(xué)習(xí)的探索中,我們會有:

  1. _半監(jiān)督學(xué)習(xí)簡介_。什么是半監(jiān)督學(xué)習(xí),它與其他學(xué)習(xí)方法相比如何,半監(jiān)督學(xué)習(xí)算法的框架/思維過程是什么?
  2. _算法:Semi-Supervised GANs_。與傳統(tǒng)GANs的比較,過程的解釋,半監(jiān)督GANs的性能。
  3. _用例和機(jī)器學(xué)習(xí)的未來_。為什么半監(jiān)督學(xué)習(xí)會有如此大的需求,哪里可以應(yīng)用。

半監(jiān)督學(xué)習(xí)介紹

半監(jiān)督學(xué)習(xí)算法代表了監(jiān)督和非監(jiān)督算法的中間地帶。雖然沒有正式定義為機(jī)器學(xué)習(xí)的“第四個(gè)”元素(監(jiān)督、無監(jiān)督、強(qiáng)化),但它將前兩個(gè)方面結(jié)合成一種自己的方法。
這些算法操作的數(shù)據(jù)有一些標(biāo)簽,但大部分是沒有標(biāo)簽的。傳統(tǒng)上,人們要么選擇有監(jiān)督學(xué)習(xí)的方式,只對帶有標(biāo)簽的數(shù)據(jù)進(jìn)行操作,這將極大地減小數(shù)據(jù)集的規(guī)模,要么,就會選擇無監(jiān)督學(xué)習(xí)的方式,丟棄標(biāo)簽保留數(shù)據(jù)集的其余部分,然后做比如聚類之類的工作。

這在現(xiàn)實(shí)世界中是很常見的。由于標(biāo)注是很昂貴的,特別是大規(guī)模數(shù)據(jù)集,特別是企業(yè)用途的,可能只有幾個(gè)標(biāo)簽。例如,考慮確定用戶活動(dòng)是否具有欺詐性。在100萬用戶中,該公司知道有1萬用戶是這樣的,但其他9萬用戶可能是惡意的,也可能是良性的。半監(jiān)督學(xué)習(xí)允許我們操作這些類型的數(shù)據(jù)集,而不必在選擇監(jiān)督學(xué)習(xí)或非監(jiān)督學(xué)習(xí)時(shí)做出權(quán)衡。
一般來說,半監(jiān)督學(xué)習(xí)算法在這個(gè)框架上運(yùn)行:

  1. 半監(jiān)督機(jī)器學(xué)習(xí)算法使用有限的標(biāo)記樣本數(shù)據(jù)集來訓(xùn)練自己,從而形成一個(gè)“部分訓(xùn)練”的模型。
  2. 部分訓(xùn)練的模型對未標(biāo)記的數(shù)據(jù)進(jìn)行標(biāo)記。由于樣本標(biāo)記數(shù)據(jù)集有許多嚴(yán)重的限制(例如,在現(xiàn)實(shí)數(shù)據(jù)中的選擇偏差),標(biāo)記的結(jié)果被認(rèn)為是“偽標(biāo)簽”數(shù)據(jù)。
  3. 結(jié)合標(biāo)記和偽標(biāo)簽數(shù)據(jù)集,創(chuàng)建一個(gè)獨(dú)特的算法,結(jié)合描述和預(yù)測方面的監(jiān)督和非監(jiān)督學(xué)習(xí)。

半監(jiān)督學(xué)習(xí)利用分類過程來識別數(shù)據(jù)資產(chǎn),利用聚類過程將其分成不同的部分。

算法:Semi-Supervised GAN

半監(jiān)督的GAN,簡稱為SGAN,是[生成對抗網(wǎng)絡(luò)](https://medium.com/analytics-... -an-直覺解釋-革命概念-2f962c858b95)架構(gòu)的一個(gè)變體,用于解決半監(jiān)督學(xué)習(xí)問題。
在傳統(tǒng)的GAN中,判別器被訓(xùn)練來預(yù)測由生成器模型生成的圖像是真實(shí)的還是假的,允許它從圖像中學(xué)習(xí)判別特征,即使沒有標(biāo)簽。盡管大多數(shù)人通常在GANs中使用訓(xùn)練很好的生成器,可以生成和數(shù)據(jù)集中相似的圖像,判別器還是可以通過以轉(zhuǎn)移學(xué)習(xí)作為起點(diǎn)在相同的數(shù)據(jù)集上建立分類器,允許監(jiān)督任務(wù)從無監(jiān)督訓(xùn)練中受益。由于大部分的圖像特征已經(jīng)被學(xué)習(xí),因此進(jìn)行分類的訓(xùn)練時(shí)間和準(zhǔn)確率會更好。
然而,在SGAN中,判別器同時(shí)接受兩種模式的訓(xùn)練:無監(jiān)督和監(jiān)督。

  • 在無監(jiān)督模式中,需要區(qū)分真實(shí)圖像和生成的圖像,就像在傳統(tǒng)的GAN中一樣。
  • 在監(jiān)督模式中,需要將一幅圖像分類為幾個(gè)類,就像在標(biāo)準(zhǔn)的神經(jīng)網(wǎng)絡(luò)分類器中一樣。

為了同時(shí)訓(xùn)練這兩種模式,判別器必須輸出1 + _n_個(gè)節(jié)點(diǎn)的值,其中1表示“真或假”節(jié)點(diǎn),_n_是預(yù)測任務(wù)中的類數(shù)。
在半監(jiān)督GAN中,對判別器模型進(jìn)行更新,預(yù)測K+1個(gè)類,其中K為預(yù)測問題中的類數(shù),并為一個(gè)新的“_假_”類添加額外的類標(biāo)簽。它涉及到同時(shí)訓(xùn)練無監(jiān)督分類任務(wù)和有監(jiān)督分類任務(wù)的判別器模型。整個(gè)數(shù)據(jù)集都可以通過SGAN進(jìn)行傳遞 —— 當(dāng)一個(gè)訓(xùn)練樣本有標(biāo)簽時(shí),判別器的權(quán)值將被調(diào)整,否則,分類任務(wù)將被忽略,判別器將調(diào)整權(quán)值以更好地區(qū)分真實(shí)的圖像和生成的圖像。

雖然允許SGAN進(jìn)行無監(jiān)督訓(xùn)練,允許模型從一個(gè)非常大的未標(biāo)記數(shù)據(jù)集中學(xué)習(xí)非常有用的特征提取,但有監(jiān)督學(xué)習(xí)允許模型利用提取的特征并將其用于分類任務(wù)。其結(jié)果是一個(gè)分類器可以在像MNIST這樣的標(biāo)準(zhǔn)問題上取得令人難以置信的結(jié)果,即使是在非常非常少的標(biāo)記樣本(數(shù)十到數(shù)百個(gè))上進(jìn)行訓(xùn)練。
SGAN巧妙地結(jié)合了無監(jiān)督和監(jiān)督學(xué)習(xí)的方面,強(qiáng)強(qiáng)聯(lián)合,以最小的標(biāo)簽量,產(chǎn)生難以置信的結(jié)果。

用例和機(jī)器學(xué)習(xí)的未來

在一個(gè)可用數(shù)據(jù)量呈指數(shù)級增長的時(shí)代,無監(jiān)督數(shù)據(jù)根本不能停下來等待標(biāo)注。無數(shù)真實(shí)世界的數(shù)據(jù)場景會像這樣出現(xiàn) —— 例如,YouTube視頻或網(wǎng)站內(nèi)容。從爬蟲引擎和內(nèi)容聚合系統(tǒng)到圖像和語音識別,半監(jiān)督學(xué)習(xí)被廣泛應(yīng)用。
半監(jiān)督學(xué)習(xí)將監(jiān)督學(xué)習(xí)和非監(jiān)督學(xué)習(xí)的過擬合和“不擬合”傾向(分別)結(jié)合起來的能力,創(chuàng)建了一個(gè)模型,在給出最小數(shù)量的標(biāo)記數(shù)據(jù)和大量的未標(biāo)記數(shù)據(jù)的情況下,可以出色地執(zhí)行分類任務(wù)。除了分類任務(wù),半監(jiān)督算法還有許多其他用途,如增強(qiáng)聚類和異常檢測。盡管這一領(lǐng)域本身相對較新,但由于在當(dāng)今的數(shù)字領(lǐng)域中發(fā)現(xiàn)了巨大的需求,算法一直在不斷地被創(chuàng)造和完善。
半監(jiān)督學(xué)習(xí)確實(shí)是機(jī)器學(xué)習(xí)的未來。

—END—

英文原文:https://towardsdatascience.co...

推薦閱讀

關(guān)注圖像處理,自然語言處理,機(jī)器學(xué)習(xí)等人工智能領(lǐng)域,請點(diǎn)擊關(guān)注AI公園專欄
歡迎關(guān)注微信公眾號

審核編輯:符乾江
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1803

    文章

    48387

    瀏覽量

    244509
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8477

    瀏覽量

    133792
收藏 0人收藏

    評論

    相關(guān)推薦

    使用卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行圖像分類的步驟

    (例如,高分辨率、不同光照條件等)。 2. 數(shù)據(jù)收集 獲取數(shù)據(jù)集 :收集或購買一個(gè)包含你想要分類的圖像的數(shù)據(jù)集。 數(shù)據(jù)標(biāo)注 :確保所有圖像都被正確標(biāo)注,這對于監(jiān)督學(xué)習(xí)是必要的。 3. 數(shù)據(jù)預(yù)處理 圖像尺寸標(biāo)準(zhǔn)化 :將所有圖像調(diào)整為相同的尺寸,
    的頭像 發(fā)表于 11-15 15:01 ?672次閱讀

    時(shí)空引導(dǎo)下的時(shí)間序列自監(jiān)督學(xué)習(xí)框架

    【導(dǎo)讀】最近,香港科技大學(xué)、上海AI Lab等多個(gè)組織聯(lián)合發(fā)布了一篇時(shí)間序列無監(jiān)督預(yù)訓(xùn)練的文章,相比原來的TS2Vec等時(shí)間序列表示學(xué)習(xí)工作,核心在于提出了將空間信息融入到預(yù)訓(xùn)練階段,即在預(yù)訓(xùn)練階段
    的頭像 發(fā)表于 11-15 11:41 ?559次閱讀
    時(shí)空引導(dǎo)下的時(shí)間序列自<b class='flag-5'>監(jiān)督學(xué)習(xí)</b>框架

    曙光公司成都云中心助力提升監(jiān)督質(zhì)效

    數(shù)字化時(shí)代,用好大數(shù)據(jù),推動(dòng)數(shù)字技術(shù)深度融入紀(jì)檢監(jiān)察各項(xiàng)業(yè)務(wù),是大勢所趨。當(dāng)前,各地正在探索推進(jìn)大數(shù)據(jù)監(jiān)督,借助海量數(shù)據(jù)、算力、算法,不斷延伸監(jiān)督的觸角,拓展發(fā)現(xiàn)問題的渠道。以“算力”補(bǔ)“人力”,“人去看”加“云端算”,大數(shù)據(jù)在類案分析、預(yù)警糾治、溯源治理等方面,正發(fā)揮越
    的頭像 發(fā)表于 11-05 10:05 ?424次閱讀

    展會回顧 | 阿丘科技亮相斯圖加特國際機(jī)器視覺展,并發(fā)表主題演講

    阿丘科技攜四大核心展品驚艷亮相:工業(yè)視覺大模型、非監(jiān)督學(xué)習(xí)技術(shù)、生成式AI技術(shù)以及電池行業(yè)檢測解決方案。這些展品全面展示了阿丘科技在工業(yè)AI視覺領(lǐng)域的深厚積累與卓
    的頭像 發(fā)表于 10-16 08:07 ?604次閱讀
    展會回顧 | 阿丘科技亮相斯圖加特國際機(jī)器視覺展,并發(fā)表主題演講

    哈爾濱工業(yè)大學(xué)在超分辨顯微成像技術(shù)領(lǐng)域取得突破性進(jìn)展

    近日,哈爾濱工業(yè)大學(xué)儀器學(xué)院先進(jìn)光電成像技術(shù)研究室(IPIC)李浩宇教授團(tuán)隊(duì)在生物醫(yī)學(xué)超分辨顯微成像技術(shù)領(lǐng)域取得突破性進(jìn)展。針對目前活體細(xì)胞超分辨成像領(lǐng)域中光子效率不足的難題,團(tuán)隊(duì)提出一種基于無監(jiān)督學(xué)習(xí)
    的頭像 發(fā)表于 09-27 06:33 ?422次閱讀
    哈爾濱工業(yè)大學(xué)在超分辨顯微成像技術(shù)領(lǐng)域取得突破性進(jìn)展

    【《大語言模型應(yīng)用指南》閱讀體驗(yàn)】+ 基礎(chǔ)知識學(xué)習(xí)

    收集海量的文本數(shù)據(jù)作為訓(xùn)練材料。這些數(shù)據(jù)集不僅包括語法結(jié)構(gòu)的學(xué)習(xí),還包括對語言的深層次理解,如文化背景、語境含義和情感色彩等。 自監(jiān)督學(xué)習(xí):模型采用自監(jiān)督學(xué)習(xí)策略,在大量無標(biāo)簽文本數(shù)據(jù)上學(xué)習(xí)
    發(fā)表于 08-02 11:03

    【《大語言模型應(yīng)用指南》閱讀體驗(yàn)】+ 基礎(chǔ)篇

    章節(jié)最后總結(jié)了機(jī)器學(xué)習(xí)的分類:有監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)、監(jiān)督學(xué)習(xí)、自監(jiān)督學(xué)習(xí)和強(qiáng)化
    發(fā)表于 07-25 14:33

    旗晟機(jī)器人人員行為監(jiān)督AI智慧算法

    ,以實(shí)現(xiàn)對工業(yè)場景巡檢運(yùn)維的高效化目標(biāo)。那么,下面我們來談?wù)勂礻蓹C(jī)器人AI智慧算法之一——人員行為監(jiān)督AI智慧算法。 旗晟人員行為監(jiān)督AI智慧算法是通過各類采集設(shè)備與AI服務(wù)器,結(jié)合行業(yè)大數(shù)據(jù)庫積累以及自研AI深度學(xué)習(xí)算法模
    的頭像 發(fā)表于 07-24 17:05 ?430次閱讀
    旗晟機(jī)器人人員行為<b class='flag-5'>監(jiān)督</b>AI智慧算法

    神經(jīng)網(wǎng)絡(luò)如何用無監(jiān)督算法訓(xùn)練

    神經(jīng)網(wǎng)絡(luò)作為深度學(xué)習(xí)的重要組成部分,其訓(xùn)練方式多樣,其中無監(jiān)督學(xué)習(xí)是一種重要的訓(xùn)練策略。無監(jiān)督學(xué)習(xí)旨在從未標(biāo)記的數(shù)據(jù)中發(fā)現(xiàn)數(shù)據(jù)內(nèi)在的結(jié)構(gòu)、模式或規(guī)律,從而提取有用的特征表示。這種訓(xùn)練方式對于大規(guī)模未
    的頭像 發(fā)表于 07-09 18:06 ?1200次閱讀

    深度學(xué)習(xí)中的無監(jiān)督學(xué)習(xí)方法綜述

    應(yīng)用中往往難以實(shí)現(xiàn)。因此,無監(jiān)督學(xué)習(xí)在深度學(xué)習(xí)中扮演著越來越重要的角色。本文旨在綜述深度學(xué)習(xí)中的無監(jiān)督學(xué)習(xí)方法,包括自編碼器、生成對抗網(wǎng)絡(luò)、聚類算法等,并分析它們的原理、應(yīng)用場景以及優(yōu)
    的頭像 發(fā)表于 07-09 10:50 ?1326次閱讀

    前饋神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)和常見激活函數(shù)

    和激活函數(shù)的非線性變換,能夠學(xué)習(xí)和模擬復(fù)雜的函數(shù)映射,從而解決各種監(jiān)督學(xué)習(xí)任務(wù)。本文將詳細(xì)闡述前饋神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu),包括其組成層、權(quán)重和偏置、激活函數(shù)等,并介紹幾種常見的激活函數(shù)及其特性。
    的頭像 發(fā)表于 07-09 10:31 ?1429次閱讀

    神經(jīng)網(wǎng)絡(luò)反向傳播算法原理是什么

    神經(jīng)網(wǎng)絡(luò)反向傳播算法(Backpropagation Algorithm)是一種用于訓(xùn)練多層前饋神經(jīng)網(wǎng)絡(luò)的監(jiān)督學(xué)習(xí)算法。它通過最小化損失函數(shù)來調(diào)整網(wǎng)絡(luò)的權(quán)重和偏置,從而提高網(wǎng)絡(luò)的預(yù)測性能。本文將詳細(xì)
    的頭像 發(fā)表于 07-02 14:16 ?988次閱讀

    基于FPGA的類腦計(jì)算平臺 —PYNQ 集群的無監(jiān)督圖像識別類腦計(jì)算系統(tǒng)

    STDP 無監(jiān)督學(xué)習(xí)算法,可運(yùn)用于圖像的 無監(jiān)督分類。 從平臺設(shè)計(jì)角度: (1)本設(shè)計(jì)搭建的基于 PYNQ 集群的通用低功耗的大規(guī)模類腦計(jì)算平臺,搭載 PYNN,NEST 等通用 SNN
    發(fā)表于 06-25 18:35

    易華錄產(chǎn)品檢測中心順利通過CNAS資質(zhì)監(jiān)督評審

    近日,經(jīng)中國合格評定國家認(rèn)可委員會評審組現(xiàn)場評審,易華錄產(chǎn)品檢測中心順利通過CNAS資質(zhì)監(jiān)督評審。
    的頭像 發(fā)表于 05-15 17:26 ?766次閱讀
    易華錄產(chǎn)品檢測中心順利通過CNAS資質(zhì)<b class='flag-5'>監(jiān)督</b>評審

    監(jiān)督深度學(xué)習(xí)實(shí)現(xiàn)單次非相干全息3D成像

    論文信息 背景引入 數(shù)字全息術(shù)因其能夠從單一視點(diǎn)對3D場景進(jìn)行成像而備受關(guān)注。與直接成像相比,數(shù)字全息是一種間接的多步驟成像過程,包括光學(xué)記錄全息圖和數(shù)值計(jì)算重建,為包括深度學(xué)習(xí)在內(nèi)的計(jì)算成像方法
    的頭像 發(fā)表于 05-13 17:38 ?687次閱讀
    無<b class='flag-5'>監(jiān)督</b>深度<b class='flag-5'>學(xué)習(xí)</b>實(shí)現(xiàn)單次非相干全息3D成像

    電子發(fā)燒友

    中國電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會員交流學(xué)習(xí)
    • 獲取您個(gè)性化的科技前沿技術(shù)信息
    • 參加活動(dòng)獲取豐厚的禮品