0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

機器學習算法中有監(jiān)督和無監(jiān)督學習的區(qū)別

我快閉嘴 ? 來源:今日頭條 ? 作者:今日頭條 ? 2020-07-07 10:18 ? 次閱讀

機器學習人工智能的一個子集,它通過示例和經驗教會計算機執(zhí)行任務,是研究和開發(fā)的熱門領域。我們每天使用的許多應用程序都使用機器學習算法,包括AI助手,Web搜索和機器翻譯。

您的社交媒體新聞提要由機器學習算法提供支持。您看到的推薦視頻是機器學習模型的結果。Spotify的“發(fā)現周刊”利用機器學習算法的強大功能來創(chuàng)建符合您喜好的歌曲列表。

但是機器學習有許多不同的風格。在這篇文章中,我們將探討有監(jiān)督和無監(jiān)督學習,這是機器學習算法的兩個主要類別。每個子集由許多適合各種任務的不同算法組成。

關于機器學習的快速筆記

在深入研究有監(jiān)督和無監(jiān)督學習之前,我們先來了解一下什么是機器學習。當今的AI系統(tǒng)以最簡單的形式將輸入轉換為輸出。例如,圖像分類器將圖像或視頻幀作為輸入,并輸出圖像中包含的對象的種類。欺詐檢測算法將支付數據作為輸入,并輸出交易欺詐的可能性。下棋的AI將棋盤的當前狀態(tài)作為輸入并輸出下一個動作。

開發(fā)智能系統(tǒng)的經典方法稱為符號人工智能,要求程序員明確指定將輸入映射到輸出的規(guī)則。盡管符號AI有很多好處,但在輸入可以以多種形式出現的領域中使用有限,例如計算機視覺,語音識別和自然語言處理。

相反,機器學習使用不同的方法來發(fā)展行為。在創(chuàng)建ML系統(tǒng)時,開發(fā)人員會創(chuàng)建一個通用結構,并在許多示例中進行培訓。這些示例可以是帶有相應圖像的圖片,國際象棋游戲數據,客戶購買的物品,用戶聽過的歌曲或與AI模型要解決的問題有關的任何其他數據。在分析了訓練數據之后,機器學習算法對其內部參數進行了調整,以能夠處理新的輸入數據。

監(jiān)督學習

Logistic回歸是一種有監(jiān)督的機器學習算法,可以將輸入分類為不同的類

如果您關注人工智能新聞,您可能已經聽說過AI算法需要很多人工標記的示例。這些故事指的是監(jiān)督學習,這是機器學習算法中比較流行的類別。監(jiān)督式機器學習適用于您知道輸入數據結果的情況。假設您要創(chuàng)建一個圖像分類機器學習算法,該算法可以檢測貓,狗和馬的圖像。

要訓練AI模型,您必須收集貓,狗和馬照片的大型數據集。但是在將它們輸入機器學習算法之前,您必須使用它們各自類的名稱對其進行注釋。批注可能包括使用文件命名約定將每個類的圖像放在單獨的文件夾中,或將元數據附加到圖像文件中。這是費力的手動任務,在提到AI血汗工廠的故事中經常提到。

標記數據后,機器學習算法(例如卷積神經網絡或支持向量機)將處理這些示例并開發(fā)可將每個圖像映射到其正確類別的數學模型。如果對AI模型進行足夠的帶標簽的示例訓練,它將能夠準確地檢測出包含貓,狗,馬的新圖像類別。

監(jiān)督機器學習解決了兩種類型的問題:分類和回歸。上面說明的示例是一個分類問題,其中機器學習模型必須將輸入放入特定的存儲桶或類別中。分類問題的另一個示例是語音識別。

回歸機器學習模型不限于特定類別。它們可以具有連續(xù)的無限值,例如客戶將為產品支付多少費用或明天下雨的可能性。

一些常見的監(jiān)督學習算法包括:

· 線性和邏輯回歸

· 樸素貝葉斯

· 支持向量機

· 決策樹和隨機森林

· 人工神經網絡

· 無監(jiān)督學習

假設您是一個電子商務零售企業(yè)所有者,他擁有成千上萬的客戶銷售記錄。您想找出哪些客戶有共同的購買習慣,以便您可以使用該信息向他們提出相關建議并改善您的追加銷售政策。問題是您沒有預定義的類別將客戶劃分為多個類別。因此,您不能訓練監(jiān)督式機器學習模型來對客戶進行分類。

這是一個聚類問題,主要用于無監(jiān)督機器學習。與監(jiān)督學習不同,無監(jiān)督機器學習不需要標記數據。它仔細研究了訓練示例,并根據它們的共同特征將它們分為幾類。訓練有素的無監(jiān)督機器學習算法會將您的客戶劃分為相關的集群。這將幫助您根據客戶與集群中其他人的共同偏好來預測客戶將購買的產品。

K-means是眾所周知的無監(jiān)督聚類機器學習算法。使用k均值的挑戰(zhàn)之一是知道將數據劃分為多少個群集。太少的包會打包不太相似的數據,而太多的簇只會使您的模型復雜且不準確。除了聚類之外,無監(jiān)督學習還可以執(zhí)行降維。當數據集具有太多特征時,可以使用降維。假設您有一個有關客戶的信息表,該表有100列。擁有有關您的客戶的大量數據可能聽起來很有趣。但實際上并非如此。

隨著數據中功能數量的增加,您還將需要更大的樣本集來訓練準確的機器學習模型。您可能沒有足夠的樣本來訓練100列模型。太多的功能也增加了過度擬合的機會,這實際上意味著您的AI模型在訓練數據上表現良好,而在其他數據上表現不佳。

無監(jiān)督的機器學習算法可以分析數據并找到不相關的特征,可以將其刪除以簡化模型而不會失去寶貴的見解。例如,對于我們的客戶表,通過降維算法運行它之后,我們可能會發(fā)現與客戶的年齡和家庭住址相關的功能幾乎沒有關聯,因此可以將其刪除。

主成分分析(PCA)是一種流行的降維機器學習算法。一些安全分析師還使用無監(jiān)督的機器學習進行異常檢測,以識別組織網絡中的惡意活動。

無監(jiān)督學習的好處之一是,它不需要監(jiān)督學習必須經歷的費力的數據標記過程。但是,要權衡的是,評估其性能的有效性也非常困難。相反,通過將監(jiān)督學習算法的輸出與測試數據的實際標簽進行比較,可以很容易地衡量監(jiān)督學習算法的準確性。
責任編輯:tzh

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    32488

    瀏覽量

    271697
  • 人工智能
    +關注

    關注

    1800

    文章

    48095

    瀏覽量

    242231
  • 機器學習
    +關注

    關注

    66

    文章

    8460

    瀏覽量

    133437
收藏 人收藏

    評論

    相關推薦

    傳統(tǒng)機器學習方法和應用指導

    在上一篇文章中,我們介紹了機器學習的關鍵概念術語。在本文中,我們會介紹傳統(tǒng)機器學習的基礎知識和多種算法特征,供各位老師選擇。 01 傳統(tǒng)
    的頭像 發(fā)表于 12-30 09:16 ?584次閱讀
    傳統(tǒng)<b class='flag-5'>機器</b><b class='flag-5'>學習</b>方法和應用指導

    時空引導下的時間序列自監(jiān)督學習框架

    【導讀】最近,香港科技大學、上海AI Lab等多個組織聯合發(fā)布了一篇時間序列監(jiān)督預訓練的文章,相比原來的TS2Vec等時間序列表示學習工作,核心在于提出了將空間信息融入到預訓練階段,即在預訓練階段
    的頭像 發(fā)表于 11-15 11:41 ?426次閱讀
    時空引導下的時間序列自<b class='flag-5'>監(jiān)督學習</b>框架

    NPU與機器學習算法的關系

    在人工智能領域,機器學習算法是實現智能系統(tǒng)的核心。隨著數據量的激增和算法復雜度的提升,對計算資源的需求也在不斷增長。NPU作為一種專門為深度學習
    的頭像 發(fā)表于 11-15 09:19 ?782次閱讀

    人工智能、機器學習和深度學習存在什么區(qū)別

    人工智能指的是在某種程度上顯示出類似人類智能的設備。AI有很多技術,但其中一個很大的子集是機器學習——讓算法從數據中學習。
    發(fā)表于 10-24 17:22 ?2595次閱讀
    人工智能、<b class='flag-5'>機器</b><b class='flag-5'>學習</b>和深度<b class='flag-5'>學習</b>存在什么<b class='flag-5'>區(qū)別</b>

    AI大模型與傳統(tǒng)機器學習區(qū)別

    AI大模型與傳統(tǒng)機器學習在多個方面存在顯著的區(qū)別。以下是對這些區(qū)別的介紹: 一、模型規(guī)模與復雜度 AI大模型 :通常包含數十億甚至數萬億的參數,模型大小可以達到數百GB甚至更大。這些模
    的頭像 發(fā)表于 10-23 15:01 ?1722次閱讀

    【《大語言模型應用指南》閱讀體驗】+ 基礎知識學習

    收集海量的文本數據作為訓練材料。這些數據集不僅包括語法結構的學習,還包括對語言的深層次理解,如文化背景、語境含義和情感色彩等。 自監(jiān)督學習:模型采用自監(jiān)督學習策略,在大量標簽文本數據
    發(fā)表于 08-02 11:03

    【《大語言模型應用指南》閱讀體驗】+ 基礎篇

    章節(jié)最后總結了機器學習的分類:有監(jiān)督學習、監(jiān)督學習、半監(jiān)督學習、自
    發(fā)表于 07-25 14:33

    旗晟機器人人員行為監(jiān)督AI智慧算法

    ,以實現對工業(yè)場景巡檢運維的高效化目標。那么,下面我們來談談旗晟機器人AI智慧算法之一——人員行為監(jiān)督AI智慧算法。 旗晟人員行為監(jiān)督AI智
    的頭像 發(fā)表于 07-24 17:05 ?370次閱讀
    旗晟<b class='flag-5'>機器</b>人人員行為<b class='flag-5'>監(jiān)督</b>AI智慧<b class='flag-5'>算法</b>

    神經網絡如何用監(jiān)督算法訓練

    標記數據的處理尤為有效,能夠充分利用互聯網上的海量數據資源。以下將詳細探討神經網絡如何用監(jiān)督算法進行訓練,包括常見的監(jiān)督學習
    的頭像 發(fā)表于 07-09 18:06 ?1044次閱讀

    深度學習中的監(jiān)督學習方法綜述

    應用中往往難以實現。因此,監(jiān)督學習在深度學習中扮演著越來越重要的角色。本文旨在綜述深度學習中的監(jiān)督學
    的頭像 發(fā)表于 07-09 10:50 ?1137次閱讀

    深度學習與nlp的區(qū)別在哪

    深度學習和自然語言處理(NLP)是計算機科學領域中兩個非常重要的研究方向。它們之間既有聯系,也有區(qū)別。本文將介紹深度學習與NLP的區(qū)別。 深度學習
    的頭像 發(fā)表于 07-05 09:47 ?1196次閱讀

    機器學習算法原理詳解

    機器學習作為人工智能的一個重要分支,其目標是通過讓計算機自動從數據中學習并改進其性能,而無需進行明確的編程。本文將深入解讀幾種常見的機器學習
    的頭像 發(fā)表于 07-02 11:25 ?1619次閱讀

    機器學習的經典算法與應用

    關于數據機器學習就是喂入算法和數據,讓算法從數據中尋找一種相應的關系。Iris鳶尾花數據集是一個經典數據集,在統(tǒng)計學習
    的頭像 發(fā)表于 06-27 08:27 ?1779次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>學習</b>的經典<b class='flag-5'>算法</b>與應用

    基于FPGA的類腦計算平臺 —PYNQ 集群的監(jiān)督圖像識別類腦計算系統(tǒng)

    STDP 監(jiān)督學習算法,可運用于圖像的 監(jiān)督分類。 從平臺設計角度: (1)本設計搭建的基于 PYNQ 集群的通用低功耗的大規(guī)
    發(fā)表于 06-25 18:35

    深度學習與度量學習融合的綜述

    如今,機器學習的應用廣泛,包括人臉識別、醫(yī)療診斷等,為復雜問題和大量數據提供解決方案。機器學習算法能基于數據產生成功的分類模型,但每個數據都
    發(fā)表于 04-24 09:49 ?535次閱讀
    深度<b class='flag-5'>學習</b>與度量<b class='flag-5'>學習</b>融合的綜述