完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

最實用的的五種機器學習算法

電子工程師 ? 來源:安全牛 ? 作者:Alfred.N ? 2021-03-24 16:14 ? 次閱讀

本文將推薦五種機器學習算法,你應該考慮是否將它們投入應用。這五種算法覆蓋最常用于聚類、分類、數(shù)值預測和樸素貝葉斯等四個門類。

1. 聚類算法:k-means

聚類算法的目標:觀察輸入數(shù)據(jù)集,并借助數(shù)據(jù)集中不同樣本的特征差異來努力辨別不同的數(shù)據(jù)組。聚類算法最強大之處在于,它不需要本文中其他算法所需的訓練過程,您只需簡單地提供數(shù)據(jù),告訴算法你想創(chuàng)造多少簇(樣本的組別),算法會為每個簇來分配一個編號。這種規(guī)范聚類算法就是k-means。

舉個例子,你的應用可用k-means來按照營銷目的區(qū)分你的網(wǎng)絡服務的用戶。你只需要輸入(從電子商務網(wǎng)站獲取的)一組客戶的購買歷史,并確定四組客戶以進行分類營銷。此時,你為k-means提供了一個數(shù)據(jù)表,每行代表一名客戶,每列則是各種對客戶的購買行為特征(如成為客戶的時間、每月評價花費、每月評價訂單量、地理位置、對當天航運的使用比例等等)。算法會為表格增加一欄:編號1-4來表示不同的分組。

提示:使用kmeans函數(shù)或rxKmeans. 用以執(zhí)行bt rx的函數(shù)是ScaleR的一部分,所以不能支持量很大的數(shù)據(jù)集。

2&3. 兩類、多類分類算法

分類算法的目標:輸入一行數(shù)據(jù)及一個類目名稱表,通過對數(shù)據(jù)的校驗估測其所屬的類目。分類算法通常按照分類時的類目總數(shù)分為兩類和多類分類算法。在你使用種算法預測新數(shù)據(jù)前,你需要預先使用一組類目可知的數(shù)據(jù)對算法加以訓練。

不妨舉個簡單的例子來說明兩類分類算法:想象一個你希望得到是/否(或真/偽)的兩極化情形。此時,類別分別為“是”和“否”(或者“真”和“偽”)。兩類分類的典型應用是:根據(jù)歷史天氣條件(如溫度、風速、降水、氣壓)和航班信息(如航空公司、起飛時間、航班號)來預測未來航班會推遲15分鐘離開還是照常起飛。輸出分為“延遲”和“不延遲”兩類。在大多數(shù)情況下,兩類分類算法的核心是邏輯回歸的使用,后者用于生成一個在0到1范圍內(nèi)的值。如果該值小于0.5,往往會解釋為第一個類(如“不延遲”),否則會劃為第二類(如“延遲”)。

另一個應用是:預測貸款的償還情況,來作為拓展信用的一部分。你必須提供貸款人的相關數(shù)據(jù),譬如信用分數(shù)、房產(chǎn)年限、工作時長、信用卡債務總額、數(shù)據(jù)采集年份以及有貸款違約記錄。分類為“會違約”和“不會違約”。這個例子之所以非常有趣,是因為對于一些機器學習所處理的難題來說,僅僅有預測結果并不足夠,還必須知曉結論是怎樣得出的。這時多組分類算法形成的決策樹就派上用場了,決策樹中的多組分類算法可以分析從輸入到最終生成預測的過程?;氐劫J款這一案例,不妨想象你是銀行方,當你拒絕了消費者的貸款新的信用卡要求時,消費者的下一個問題可能是“為什么?”。通過決策樹,你可以具體回答:“好吧,你的信用分數(shù)太低了,信用卡債臺高筑,工作年頭又太短了。”

充分理解兩類分類算法后,進一步理解多類分類算法就順理成章了。多類分類算法可應用于電影院,來告訴后者某部電影究竟是墊底的票房毒藥(不僅口碑差,而且主流觀眾不感興趣)、口碑導向(叫好不叫座)還是票房導向(口碑差,但是票房高)。三個分類分別是“毒藥”、“口碑導向”、“票房導向”。你也可以使用決策樹,來了解一部電影為何會得到這樣的評價。

提示:使用glm或rxLogit來進行兩類或多類分類。進行多類分類時,你可以使用rpart或rxDTree來建立可觀察決策樹。

4. 數(shù)值預測

數(shù)值預測算法的目標:根據(jù)一組輸入,預測一個具體數(shù)值。仍然使用上文中航班延誤的例子,我們現(xiàn)在要做的不再是預測航班是否會推遲15分鐘,數(shù)值預測算法將讓你知曉航班將具體被推遲多久。數(shù)值預測算法的核心是線性回歸的使用(不要與分類算法使用的邏輯回歸混淆),通過對歷史數(shù)據(jù)的線性擬合,線性回歸可以有效地進行數(shù)值預測。最好的例子是股票的預測,線性回歸根據(jù)過往數(shù)據(jù)的分布,擬合出一條最合適的直線,延長這條線你就可以預測將來的股票價格。

提示:使用Im或rxLinMod函數(shù)。

5. 樸素貝葉斯算法

最后,你的采納清單上還缺一個機器學習中勞苦功高的算法——樸素貝葉斯算法。它的核心是因果關系。更具體地說,樸素貝葉斯算法是在給定已知的成因的情況下,預測這一成因?qū)a(chǎn)生的效果以及效果的程度?,F(xiàn)實生活中的典型例子是癌癥檢測。你可以通過對病人特定病狀(效果)的觀察,來預測病人患有癌癥的概率(疾病是成因)。再舉個和你相關的例子,樸素貝葉斯算法可以根據(jù)你已購買的商品為你推薦其他商品。例如,你網(wǎng)購了一些雞蛋,算法會提醒你買些牛奶,因為你的購買歷史顯示:購買雞蛋(成因)會導致購買牛奶(效果)。樸素貝葉斯有趣的一點在于,它可以用于分類和數(shù)值預測。。

提示:使用naiveBayes和rxNaiveBayes函數(shù)。

結論

好了,你有了一個實用算法的清單?,F(xiàn)在,重新審視你的應用,想一想哪些地方可以增添點機器學習帶來的智能性。

責任編輯:lq6

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 聚類算法
    +關注

    關注

    2

    文章

    118

    瀏覽量

    12241
  • 樸素貝葉斯
    +關注

    關注

    0

    文章

    12

    瀏覽量

    3428
  • 機器學習算法

    關注

    2

    文章

    47

    瀏覽量

    6567
收藏 人收藏

    評論

    相關推薦

    請問STM32部署機器學習算法硬件至少要使用哪個系列的芯片?

    STM32部署機器學習算法硬件至少要使用哪個系列的芯片?
    發(fā)表于 03-13 07:34

    機器學習模型市場前景如何

    當今,隨著算法的不斷優(yōu)化、數(shù)據(jù)量的爆炸式增長以及計算能力的飛速提升,機器學習模型的市場前景愈發(fā)廣闊。下面,AI部落小編將探討機器學習模型市場
    的頭像 發(fā)表于 02-13 09:39 ?224次閱讀

    華為云 Flexus X 實例部署安裝 Jupyter Notebook,學習 AI,機器學習算法

    前言 由于本人最近在學習一些機器算法,AI 算法的知識,需要搭建一個學習環(huán)境,所以就在最近購買的華為云 Flexus X 實例上安裝了
    的頭像 發(fā)表于 01-02 13:43 ?371次閱讀
    華為云 Flexus X 實例部署安裝 Jupyter Notebook,<b class='flag-5'>學習</b> AI,<b class='flag-5'>機器</b><b class='flag-5'>學習</b><b class='flag-5'>算法</b>

    傳統(tǒng)機器學習方法和應用指導

    在上一篇文章中,我們介紹了機器學習的關鍵概念術語。在本文中,我們會介紹傳統(tǒng)機器學習的基礎知識和多種算法特征,供各位老師選擇。 01 傳統(tǒng)
    的頭像 發(fā)表于 12-30 09:16 ?856次閱讀
    傳統(tǒng)<b class='flag-5'>機器</b><b class='flag-5'>學習</b>方法和應用指導

    什么是機器學習?通過機器學習方法能解決哪些問題?

    來源:Master編程樹“機器學習”最初的研究動機是讓計算機系統(tǒng)具有人的學習能力以便實現(xiàn)人工智能。因為沒有學習能力的系統(tǒng)很難被認為是具有智能的。目前被廣泛采用的
    的頭像 發(fā)表于 11-16 01:07 ?717次閱讀
    什么是<b class='flag-5'>機器</b><b class='flag-5'>學習</b>?通過<b class='flag-5'>機器</b><b class='flag-5'>學習</b>方法能解決哪些問題?

    NPU與機器學習算法的關系

    在人工智能領域,機器學習算法是實現(xiàn)智能系統(tǒng)的核心。隨著數(shù)據(jù)量的激增和算法復雜度的提升,對計算資源的需求也在不斷增長。NPU作為一專門為深度
    的頭像 發(fā)表于 11-15 09:19 ?965次閱讀

    LSTM神經(jīng)網(wǎng)絡與其他機器學習算法的比較

    隨著人工智能技術的飛速發(fā)展,機器學習算法在各個領域中扮演著越來越重要的角色。長短期記憶網(wǎng)絡(LSTM)作為一特殊的循環(huán)神經(jīng)網(wǎng)絡(RNN),因其在處理序列數(shù)據(jù)方面的優(yōu)勢而受到廣泛關注。
    的頭像 發(fā)表于 11-13 10:17 ?1707次閱讀

    人工智能、機器學習和深度學習存在什么區(qū)別

    人工智能指的是在某種程度上顯示出類似人類智能的設備。AI有很多技術,但其中一個很大的子集是機器學習——讓算法從數(shù)據(jù)中學習。
    發(fā)表于 10-24 17:22 ?2665次閱讀
    人工智能、<b class='flag-5'>機器</b><b class='flag-5'>學習</b>和深度<b class='flag-5'>學習</b>存在什么區(qū)別

    LIBS結合機器學習算法的江西名優(yōu)春茶采收期鑒別

    以廬山云霧茶和狗牯腦茶的明前茶、雨前茶為對象,研究激光誘導擊穿光譜結合機器學習的茶葉鑒別方法。將茶葉茶,水數(shù)據(jù)融合可有效鑒別春茶采收期,且數(shù)據(jù)融合后表現(xiàn)出更好的穩(wěn)定性和魯棒性,LIBS結合機器
    的頭像 發(fā)表于 10-22 18:05 ?501次閱讀
    LIBS結合<b class='flag-5'>機器</b><b class='flag-5'>學習</b><b class='flag-5'>算法</b>的江西名優(yōu)春茶采收期鑒別

    【「時間序列與機器學習」閱讀體驗】+ 鳥瞰這本書

    清晰,從時間序列分析的基礎理論出發(fā),逐步深入到機器學習算法在時間序列預測中的應用,內(nèi)容全面,循序漸進。每一章都經(jīng)過精心設計,對理論知識進行了詳細的闡述,對實際案例進行了生動的展示,使讀者在理論與實踐
    發(fā)表于 08-12 11:28

    深度學習的基本原理與核心算法

    隨著大數(shù)據(jù)時代的到來,傳統(tǒng)機器學習方法在處理復雜模式上的局限性日益凸顯。深度學習(Deep Learning)作為一新興的人工智能技術,以其強大的非線性表達能力和自
    的頭像 發(fā)表于 07-04 11:44 ?3136次閱讀

    機器學習算法原理詳解

    機器學習作為人工智能的一個重要分支,其目標是通過讓計算機自動從數(shù)據(jù)中學習并改進其性能,而無需進行明確的編程。本文將深入解讀幾種常見的機器學習
    的頭像 發(fā)表于 07-02 11:25 ?1958次閱讀

    機器學習在數(shù)據(jù)分析中的應用

    隨著大數(shù)據(jù)時代的到來,數(shù)據(jù)量的爆炸性增長對數(shù)據(jù)分析提出了更高的要求。機器學習作為一強大的工具,通過訓練模型從數(shù)據(jù)中學習規(guī)律,為企業(yè)和組織提供了更高效、更準確的數(shù)據(jù)分析能力。本文將深入
    的頭像 發(fā)表于 07-02 11:22 ?1099次閱讀

    深度學習與傳統(tǒng)機器學習的對比

    在人工智能的浪潮中,機器學習和深度學習無疑是兩大核心驅(qū)動力。它們各自以其獨特的方式推動著技術的進步,為眾多領域帶來了革命性的變化。然而,盡管它們都屬于機器
    的頭像 發(fā)表于 07-01 11:40 ?1986次閱讀

    機器學習的經(jīng)典算法與應用

    關于數(shù)據(jù)機器學習就是喂入算法和數(shù)據(jù),讓算法從數(shù)據(jù)中尋找一相應的關系。Iris鳶尾花數(shù)據(jù)集是一個經(jīng)典數(shù)據(jù)集,在統(tǒng)計
    的頭像 發(fā)表于 06-27 08:27 ?1867次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>學習</b>的經(jīng)典<b class='flag-5'>算法</b>與應用

    電子發(fā)燒友

    中國電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會員交流學習
    • 獲取您個性化的科技前沿技術信息
    • 參加活動獲取豐厚的禮品