0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀(guān)看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

人工智能10大流行算法分享

人工智能與大數(shù)據(jù)技術(shù) ? 來(lái)源:InfoQ ? 作者:InfoQ ? 2023-03-29 10:32 ? 次閱讀

本文為有志于成為數(shù)據(jù)科學(xué)家或?qū)Υ烁信d趣的讀者們介紹最流行的機(jī)器學(xué)習(xí)算法。

機(jī)器學(xué)習(xí)是該行業(yè)的一個(gè)創(chuàng)新且重要的領(lǐng)域。我們?yōu)闄C(jī)器學(xué)習(xí)程序選擇的算法類(lèi)型,取決于我們想要實(shí)現(xiàn)的目標(biāo)。

現(xiàn)在,機(jī)器學(xué)習(xí)有很多算法。因此,如此多的算法,可能對(duì)于初學(xué)者來(lái)說(shuō),是相當(dāng)不堪重負(fù)的。今天,我們將簡(jiǎn)要介紹 10 種最流行的機(jī)器學(xué)習(xí)算法,這樣你就可以適應(yīng)這個(gè)激動(dòng)人心的機(jī)器學(xué)習(xí)世界了!

讓我們言歸正傳!

1. 線(xiàn)性回歸

線(xiàn)性回歸(Linear Regression)可能是最流行的機(jī)器學(xué)習(xí)算法。線(xiàn)性回歸就是要找一條直線(xiàn),并且讓這條直線(xiàn)盡可能地?cái)M合散點(diǎn)圖中的數(shù)據(jù)點(diǎn)。它試圖通過(guò)將直線(xiàn)方程與該數(shù)據(jù)擬合來(lái)表示自變量(x 值)和數(shù)值結(jié)果(y 值)。然后就可以用這條線(xiàn)來(lái)預(yù)測(cè)未來(lái)的值!

這種算法最常用的技術(shù)是最小二乘法(Least of squares)。這個(gè)方法計(jì)算出最佳擬合線(xiàn),以使得與直線(xiàn)上每個(gè)數(shù)據(jù)點(diǎn)的垂直距離最小。總距離是所有數(shù)據(jù)點(diǎn)的垂直距離(綠線(xiàn))的平方和。其思想是通過(guò)最小化這個(gè)平方誤差或距離來(lái)擬合模型。

2. 邏輯回歸

邏輯回歸(Logistic regression)與線(xiàn)性回歸類(lèi)似,但它是用于輸出為二進(jìn)制的情況(即,當(dāng)結(jié)果只能有兩個(gè)可能的值)。對(duì)最終輸出的預(yù)測(cè)是一個(gè)非線(xiàn)性的 S 型函數(shù),稱(chēng)為 logistic function, g()。

這個(gè)邏輯函數(shù)將中間結(jié)果值映射到結(jié)果變量 Y,其值范圍從 0 到 1。然后,這些值可以解釋為 Y 出現(xiàn)的概率。S 型邏輯函數(shù)的性質(zhì)使得邏輯回歸更適合用于分類(lèi)任務(wù)。

3. 決策樹(shù)

決策樹(shù)(Decision Trees)可用于回歸和分類(lèi)任務(wù)。

在這一算法中,訓(xùn)練模型通過(guò)學(xué)習(xí)樹(shù)表示(Tree representation)的決策規(guī)則來(lái)學(xué)習(xí)預(yù)測(cè)目標(biāo)變量的值。樹(shù)是由具有相應(yīng)屬性的節(jié)點(diǎn)組成的。

在每個(gè)節(jié)點(diǎn)上,我們根據(jù)可用的特征詢(xún)問(wèn)有關(guān)數(shù)據(jù)的問(wèn)題。左右分支代表可能的答案。最終節(jié)點(diǎn)(即葉節(jié)點(diǎn))對(duì)應(yīng)于一個(gè)預(yù)測(cè)值。

每個(gè)特征的重要性是通過(guò)自頂向下方法確定的。節(jié)點(diǎn)越高,其屬性就越重要。

4. 樸素貝葉斯

樸素貝葉斯(Naive Bayes)是基于貝葉斯定理。它測(cè)量每個(gè)類(lèi)的概率,每個(gè)類(lèi)的條件概率給出 x 的值。這個(gè)算法用于分類(lèi)問(wèn)題,得到一個(gè)二進(jìn)制“是 / 非”的結(jié)果??纯聪旅娴姆匠淌?。

60b8f7cc-cdd8-11ed-bfe3-dac502259ad0.png

樸素貝葉斯分類(lèi)器是一種流行的統(tǒng)計(jì)技術(shù),可用于過(guò)濾垃圾郵件!

5. 支持向量機(jī)(SVM)

支持向量機(jī)(Support Vector Machine,SVM)是一種用于分類(lèi)問(wèn)題的監(jiān)督算法。支持向量機(jī)試圖在數(shù)據(jù)點(diǎn)之間繪制兩條線(xiàn),它們之間的邊距最大。為此,我們將數(shù)據(jù)項(xiàng)繪制為 n 維空間中的點(diǎn),其中,n 是輸入特征的數(shù)量。在此基礎(chǔ)上,支持向量機(jī)找到一個(gè)最優(yōu)邊界,稱(chēng)為超平面(Hyperplane),它通過(guò)類(lèi)標(biāo)簽將可能的輸出進(jìn)行最佳分離。

超平面與最近的類(lèi)點(diǎn)之間的距離稱(chēng)為邊距。最優(yōu)超平面具有最大的邊界,可以對(duì)點(diǎn)進(jìn)行分類(lèi),從而使最近的數(shù)據(jù)點(diǎn)與這兩個(gè)類(lèi)之間的距離最大化。

6. K- 最近鄰算法(KNN)

K- 最近鄰算法(K-Nearest Neighbors,KNN)非常簡(jiǎn)單。KNN 通過(guò)在整個(gè)訓(xùn)練集中搜索 K 個(gè)最相似的實(shí)例,即 K 個(gè)鄰居,并為所有這些 K 個(gè)實(shí)例分配一個(gè)公共輸出變量,來(lái)對(duì)對(duì)象進(jìn)行分類(lèi)。

K 的選擇很關(guān)鍵:較小的值可能會(huì)得到大量的噪聲和不準(zhǔn)確的結(jié)果,而較大的值是不可行的。它最常用于分類(lèi),但也適用于回歸問(wèn)題。

用于評(píng)估實(shí)例之間相似性的距離可以是歐幾里得距離(Euclidean distance)、曼哈頓距離(Manhattan distance)或明氏距離(Minkowski distance)。歐幾里得距離是兩點(diǎn)之間的普通直線(xiàn)距離。它實(shí)際上是點(diǎn)坐標(biāo)之差平方和的平方根。

7. K- 均值

K- 均值(K-means)是通過(guò)對(duì)數(shù)據(jù)集進(jìn)行分類(lèi)來(lái)聚類(lèi)的。例如,這個(gè)算法可用于根據(jù)購(gòu)買(mǎi)歷史將用戶(hù)分組。它在數(shù)據(jù)集中找到 K 個(gè)聚類(lèi)。K- 均值用于無(wú)監(jiān)督學(xué)習(xí),因此,我們只需使用訓(xùn)練數(shù)據(jù) X,以及我們想要識(shí)別的聚類(lèi)數(shù)量 K。

該算法根據(jù)每個(gè)數(shù)據(jù)點(diǎn)的特征,將每個(gè)數(shù)據(jù)點(diǎn)迭代地分配給 K 個(gè)組中的一個(gè)組。它為每個(gè) K- 聚類(lèi)(稱(chēng)為質(zhì)心)選擇 K 個(gè)點(diǎn)?;谙嗨贫?,將新的數(shù)據(jù)點(diǎn)添加到具有最近質(zhì)心的聚類(lèi)中。這個(gè)過(guò)程一直持續(xù)到質(zhì)心停止變化為止。

8. 隨機(jī)森林

隨機(jī)森林(Random Forest)是一種非常流行的集成機(jī)器學(xué)習(xí)算法。這個(gè)算法的基本思想是,許多人的意見(jiàn)要比個(gè)人的意見(jiàn)更準(zhǔn)確。在隨機(jī)森林中,我們使用決策樹(shù)集成(參見(jiàn)決策樹(shù))。

為了對(duì)新對(duì)象進(jìn)行分類(lèi),我們從每個(gè)決策樹(shù)中進(jìn)行投票,并結(jié)合結(jié)果,然后根據(jù)多數(shù)投票做出最終決定。

9. 降維

由于我們今天能夠捕獲的數(shù)據(jù)量之大,機(jī)器學(xué)習(xí)問(wèn)題變得更加復(fù)雜。這就意味著訓(xùn)練極其緩慢,而且很難找到一個(gè)好的解決方案。這一問(wèn)題,通常被稱(chēng)為“維數(shù)災(zāi)難”(Curse of dimensionality)。

降維(Dimensionality reduction)試圖在不丟失最重要信息的情況下,通過(guò)將特定的特征組合成更高層次的特征來(lái)解決這個(gè)問(wèn)題。主成分分析(Principal Component Analysis,PCA)是最流行的降維技術(shù)。

主成分分析通過(guò)將數(shù)據(jù)集壓縮到低維線(xiàn)或超平面 / 子空間來(lái)降低數(shù)據(jù)集的維數(shù)。這盡可能地保留了原始數(shù)據(jù)的顯著特征。

可以通過(guò)將所有數(shù)據(jù)點(diǎn)近似到一條直線(xiàn)來(lái)實(shí)現(xiàn)降維的示例。

10. 人工神經(jīng)網(wǎng)絡(luò)(ANN)

人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Networks,ANN)可以處理大型復(fù)雜的機(jī)器學(xué)習(xí)任務(wù)。神經(jīng)網(wǎng)絡(luò)本質(zhì)上是一組帶有權(quán)值的邊和節(jié)點(diǎn)組成的相互連接的層,稱(chēng)為神經(jīng)元。在輸入層和輸出層之間,我們可以插入多個(gè)隱藏層。人工神經(jīng)網(wǎng)絡(luò)使用了兩個(gè)隱藏層。除此之外,還需要處理深度學(xué)習(xí)。

人工神經(jīng)網(wǎng)絡(luò)的工作原理與大腦的結(jié)構(gòu)類(lèi)似。一組神經(jīng)元被賦予一個(gè)隨機(jī)權(quán)重,以確定神經(jīng)元如何處理輸入數(shù)據(jù)。通過(guò)對(duì)輸入數(shù)據(jù)訓(xùn)練神經(jīng)網(wǎng)絡(luò)來(lái)學(xué)習(xí)輸入和輸出之間的關(guān)系。在訓(xùn)練階段,系統(tǒng)可以訪(fǎng)問(wèn)正確的答案。

如果網(wǎng)絡(luò)不能準(zhǔn)確識(shí)別輸入,系統(tǒng)就會(huì)調(diào)整權(quán)重。經(jīng)過(guò)充分的訓(xùn)練后,它將始終如一地識(shí)別出正確的模式。

每個(gè)圓形節(jié)點(diǎn)表示一個(gè)人工神經(jīng)元,箭頭表示從一個(gè)人工神經(jīng)元的輸出到另一個(gè)人工神經(jīng)元的輸入的連接。

接下來(lái)是什么?現(xiàn)在,你已經(jīng)了解了最流行的機(jī)器學(xué)習(xí)算法的基礎(chǔ)介紹。你已經(jīng)準(zhǔn)備好學(xué)習(xí)更為復(fù)雜的概念,甚至可以通過(guò)深入的動(dòng)手實(shí)踐來(lái)實(shí)現(xiàn)它們。如果你想了解如何實(shí)現(xiàn)這些算法,可以參考 Educative 出品的 Grokking Data Science 課程,該課程將這些激動(dòng)人心的理論應(yīng)用于清晰、真實(shí)的應(yīng)用程序。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀(guān)點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4622

    瀏覽量

    93053
  • 人工智能
    +關(guān)注

    關(guān)注

    1792

    文章

    47424

    瀏覽量

    238947
  • 人工神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    1

    文章

    120

    瀏覽量

    14644
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8425

    瀏覽量

    132769

原文標(biāo)題:人工智能10大流行算法,通俗易懂講明白

文章出處:【微信號(hào):TheBigData1024,微信公眾號(hào):人工智能與大數(shù)據(jù)技術(shù)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    人工智能是什么?

    的階段。阻礙前行的因素很多,要攻克的技術(shù)難點(diǎn)也很多,但這些問(wèn)題在人工智能領(lǐng)域的專(zhuān)家來(lái)看,技術(shù)的積累都只是時(shí)間問(wèn)題,對(duì)人工智能技術(shù)做更進(jìn)一步剖析的話(huà),其實(shí)就是“算法”+“海量數(shù)據(jù)”。更通俗一點(diǎn)就是:在
    發(fā)表于 09-16 15:40

    百度人工智能大神離職,人工智能的出路在哪?

    被打上人工智能的標(biāo)簽,一派欣欣向榮之景仿佛在宣示,這是人工智能技術(shù)發(fā)展的最好時(shí)代,但是,在市場(chǎng)火熱的背后,我們需要理性的思考。 目前,人工智能行業(yè)內(nèi)存在很大的水分,很多企業(yè)隨大流進(jìn)入這
    發(fā)表于 03-23 17:00

    分享:人工智能算法將帶領(lǐng)機(jī)器人走向何方?

    )機(jī)器人是可編程的;(3)機(jī)器人通常是自主或半自主的; 什么是人工智能人工智能是一個(gè)大的范疇,里面包括了很多小的分支,是依靠算法實(shí)現(xiàn)的,它通過(guò)開(kāi)發(fā)計(jì)算機(jī)程序來(lái)完成智能的任務(wù),能幫助載體利用最短的時(shí)間找到
    發(fā)表于 08-16 10:44

    人工智能就業(yè)前景

    據(jù)相關(guān)招聘機(jī)構(gòu)數(shù)據(jù)顯示,2018年AI領(lǐng)域仍然是大部分資深技術(shù)人才轉(zhuǎn)崗的首選目標(biāo),在人才最緊缺的前十大職位中,時(shí)下最火的大數(shù)據(jù)、人工智能、算法類(lèi)崗位占據(jù)半壁江山。據(jù)調(diào)查指出,2017年技術(shù)研發(fā)類(lèi)崗位
    發(fā)表于 03-29 15:46

    人工智能和機(jī)器學(xué)習(xí)的前世今生

    、人工智能和深度學(xué)習(xí)、物聯(lián)網(wǎng)(IOT)以及大數(shù)據(jù)將從他們那些不太知情的同行那里帶走超過(guò)1兆2000億美元。數(shù)據(jù)是機(jī)器學(xué)習(xí)的關(guān)鍵。算法從一定數(shù)量的數(shù)據(jù)中學(xué)習(xí),然后應(yīng)用這種學(xué)習(xí)來(lái)做出明智的決策
    發(fā)表于 08-27 10:16

    全語(yǔ)音人工智能AI耳機(jī),或?qū)⒁?b class='flag-5'>智能耳機(jī)市場(chǎng)

    ``2017年,在中國(guó)媒體十大流行語(yǔ)中,人工智能逐漸受大眾所熟知。而最初將人工智能這一概念在大眾中普及開(kāi)來(lái),無(wú)疑是智能音箱了。如:小度智能
    發(fā)表于 11-02 11:55

    解讀人工智能的未來(lái)

    `已歷經(jīng)60多年的人工智能在物聯(lián)網(wǎng)以及大數(shù)據(jù)的推動(dòng)下,實(shí)現(xiàn)飛躍式的發(fā)展,并且迎來(lái)了第三個(gè)黃金周期。必優(yōu)傳感今天和大家解讀一下關(guān)于人工智能的未來(lái)。自從有了人工智能,引發(fā)了人類(lèi)的各種“未來(lái)論”。有人說(shuō)
    發(fā)表于 11-14 10:43

    人工智能技術(shù)及算法設(shè)計(jì)指南

    手把手教你設(shè)計(jì)人工智能芯片及系統(tǒng)(全階設(shè)計(jì)教程+AI芯片F(xiàn)PGA實(shí)現(xiàn)+開(kāi)發(fā)板)詳情鏈接:http://url.elecfans.com/u/c422a4bd15人工智能各種技術(shù)與算法
    發(fā)表于 02-12 14:07

    人工智能醫(yī)生未來(lái)或上線(xiàn),人工智能醫(yī)療市場(chǎng)規(guī)模持續(xù)增長(zhǎng)

    。   人工智能和醫(yī)療的結(jié)合被看作未來(lái)5-10年的投資熱點(diǎn)之一。根據(jù)前瞻產(chǎn)業(yè)研究院的報(bào)告,中國(guó)人工智能+醫(yī)療市場(chǎng)規(guī)模在持續(xù)增長(zhǎng),2017年超130億元,增長(zhǎng)40.7%,2018年市場(chǎng)規(guī)模約200億元。那么
    發(fā)表于 02-24 09:29

    智能控制、人工智能、智能算法的發(fā)展前景怎么樣

    淺談智能控制、人工智能、智能算法的發(fā)展前景
    發(fā)表于 05-10 01:21

    人工智能:超越炒作

    。對(duì)于人工智能用例在當(dāng)前物聯(lián)網(wǎng)環(huán)境中變?yōu)楝F(xiàn)實(shí),必須滿(mǎn)足三個(gè)條件:非常大的真實(shí)數(shù)據(jù)集具有重要處理能力的硬件架構(gòu)和環(huán)境開(kāi)發(fā)新的強(qiáng)大算法人工神經(jīng)網(wǎng)絡(luò)(ANN)以充分利用上述內(nèi)容很明顯,后兩種要求相互依賴(lài),并且
    發(fā)表于 05-29 10:46

    人工智能芯片是人工智能發(fā)展的

    人工智能芯片是人工智能發(fā)展的 | 特倫斯謝諾夫斯基責(zé)編 | 屠敏本文內(nèi)容經(jīng)授權(quán)摘自《深度學(xué)習(xí) 智能時(shí)代的核心驅(qū)動(dòng)力量》從AlphaGo的人機(jī)對(duì)戰(zhàn),到無(wú)人駕駛汽車(chē)的上路,再到AI合成主播上崗
    發(fā)表于 07-27 07:02

    一文看懂人工智能語(yǔ)音芯片 精選資料分享

    以來(lái),谷歌、百度、阿里、騰訊等互聯(lián)網(wǎng)巨頭以及多家知名的風(fēng)險(xiǎn)投資基金瘋狂涌入人工智能行業(yè),大力推動(dòng)各初創(chuàng)算法(方案)公司在多個(gè)應(yīng)用領(lǐng)域商業(yè)化落地。隨著人工智能在視覺(jué)識(shí)別...
    發(fā)表于 07-29 08:42

    人工智能基本概念機(jī)器學(xué)習(xí)算法

    目錄人工智能基本概念機(jī)器學(xué)習(xí)算法1. 決策樹(shù)2. KNN3. KMEANS4. SVM5. 線(xiàn)性回歸深度學(xué)習(xí)算法1. BP2. GANs3. CNN4. LSTM應(yīng)用人工智能基本概念數(shù)
    發(fā)表于 09-06 08:21

    《移動(dòng)終端人工智能技術(shù)與應(yīng)用開(kāi)發(fā)》人工智能的發(fā)展與AI技術(shù)的進(jìn)步

    人工智能的發(fā)展是隨著人類(lèi)生活需要,產(chǎn)業(yè)需求不斷提升的,其中人工智能的發(fā)展很大程度上受到了計(jì)算機(jī)算力的影響,隨著數(shù)據(jù)處理量的增大,人工智能算法對(duì)算力的要求逐年增加,而且沒(méi)過(guò)兩年算力上升一倍,因此往往
    發(fā)表于 02-17 11:00