0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Scikit-learn機(jī)器學(xué)習(xí)庫(kù)的概念及工作原理

NVIDIA英偉達(dá) ? 來(lái)源:NVIDIA英偉達(dá) ? 作者: NVIDIA英偉達(dá) ? 2022-09-30 11:00 ? 次閱讀

作為一個(gè)適用于 Python 編程語(yǔ)言的機(jī)器學(xué)習(xí) (ML) 庫(kù),Scikit-learn 擁有大量算法,可供程序員和數(shù)據(jù)科學(xué)家在機(jī)器學(xué)習(xí)模型中輕松部署。

什么是 Scikit-learn?

Scikit-learn 是一個(gè)熱門(mén)且可靠的機(jī)器學(xué)習(xí)庫(kù),擁有各種算法,同時(shí)也是用于 ML 可視化、預(yù)處理、模型擬合、選擇和評(píng)估的工具。

Scikit-learn 基于 NumPy、SciPy 和 matplotlib 構(gòu)建,并具有大量用于分類(lèi)、回歸和集群的高效算法。其中包括支持向量機(jī)、隨機(jī)森林、梯度提升、k-means 和 DBSCAN。

Scikit-learn 擁有一致且設(shè)計(jì)高效的 API、適用于大多數(shù)算法的豐富文檔以及大量在線教程,因此相對(duì)易于開(kāi)發(fā)。

當(dāng)前版本可用于 Linux、MacOS 和 Windows 等熱門(mén)平臺(tái)。

為何選擇 Scikit-learn?

得益于其相對(duì)易于使用、且設(shè)計(jì)周到又充滿熱情的社區(qū),Scikit-learn API 已成為機(jī)器學(xué)習(xí)實(shí)施的實(shí)際標(biāo)準(zhǔn)。

Scikit-learn 為 ML 模型構(gòu)建、擬合及評(píng)估提供了以下模塊:

預(yù)處理是指 Scikit-learn 工具,這些工具可用于數(shù)據(jù)分析期間的特征提取和歸一化。

分類(lèi)是指一組工具,這組工具可識(shí)別機(jī)器學(xué)習(xí)模型中與數(shù)據(jù)相關(guān)的類(lèi)別。例如,這些工具還可用于將電子郵件分類(lèi)為有效郵件或垃圾郵件。實(shí)際上,分類(lèi)可確定目標(biāo)所屬的類(lèi)別。

回歸是指 ML 模型的創(chuàng)建,該模型試圖理解輸入和輸出數(shù)據(jù)(例如行為或股票價(jià)格)之間的關(guān)系?;貧w可預(yù)測(cè)與目標(biāo)關(guān)聯(lián)的連續(xù)值屬性。

Scikit-learn 中的聚類(lèi)工具自動(dòng)將具有相似特征的數(shù)據(jù)以集的形式進(jìn)行分組,例如根據(jù)物理位置排列成集的客戶數(shù)據(jù)。

降維可減少用于分析的隨機(jī)變量數(shù)量。例如,為了提升可視化的效率,可能會(huì)將離散數(shù)據(jù)排除在外。

模型選擇是指算法及其提供相應(yīng)工具的能力,并且這些工具能夠比較、驗(yàn)證和選擇最佳參數(shù),以將其用于數(shù)據(jù)科學(xué)機(jī)器學(xué)習(xí)項(xiàng)目。

流程是指用于構(gòu)建模型工作流程的實(shí)用程序。

機(jī)器學(xué)習(xí)可視化可支持快速繪圖和視覺(jué)調(diào)整。

Scikit-learn 的工作原理

Scikit-learn 主要采用 Python 編寫(xiě),并使用 NumPy 進(jìn)行高性能線性代數(shù)以及數(shù)組運(yùn)算。一些核心 Scikit-learn 算法則采用 Cython 編寫(xiě),以提升整體性能。

作為更高級(jí)別的庫(kù),它包含各種機(jī)器學(xué)習(xí)算法的幾種實(shí)施,Scikit-learn 讓用戶僅使用幾行代碼即可構(gòu)建、訓(xùn)練和評(píng)估模型。

Scikit-learn 還提供一套統(tǒng)一的高級(jí)別 API,以供構(gòu)建 ML 流程或工作流程使用。

在 Scikit-learn ML 流程中,您可以通過(guò)轉(zhuǎn)換器傳遞數(shù)據(jù)并提取特征,使用估測(cè)器生成模型,并使用評(píng)估器測(cè)量模型的準(zhǔn)確性。

Transformer:這是一種轉(zhuǎn)換或輸入數(shù)據(jù),以進(jìn)行預(yù)處理的算法。

Estimator:這是一種機(jī)器學(xué)習(xí)算法,用于訓(xùn)練或擬合數(shù)據(jù),以構(gòu)建可用于預(yù)測(cè)的模型。

流程:流程將多個(gè)轉(zhuǎn)換器和估測(cè)器相連接,從而指定 ML 工作流程。

GPU 加速的 Scikit-learn API 和端到端數(shù)據(jù)科學(xué)

在架構(gòu)方面,CPU 僅由幾個(gè)具有大緩存內(nèi)存的核心組成,一次只可以處理幾個(gè)軟件線程。相比之下,GPU 由數(shù)百個(gè)核心組成,可以同時(shí)處理數(shù)千個(gè)線程。

基于 CUDA-X AI 創(chuàng)建的 NVIDIA RAPIDS 開(kāi)源軟件庫(kù)套件使您完全能夠在 GPU 上執(zhí)行端到端數(shù)據(jù)科學(xué)和分析流程。此套件依靠 NVIDIA CUDA 基元進(jìn)行低級(jí)別計(jì)算優(yōu)化,但通過(guò)用戶友好型 Python 接口能夠?qū)崿F(xiàn) GPU 并行化和高帶寬顯存速度。

RAPIDS cuML 的機(jī)器學(xué)習(xí)算法和數(shù)學(xué)基元遵循熟悉的類(lèi)似于 scikit-learn 的 API。單塊 GPU 和大型數(shù)據(jù)中心部署均支持 XGBoost、隨機(jī)森林等主流算法。針對(duì)大型數(shù)據(jù)集,相較于同等功效的 CPU,這些基于 GPU 的實(shí)施方案能夠以 10 到 50 倍的速度更快地完成任務(wù)。

借助 RAPIDS GPU DataFrame,數(shù)據(jù)可以通過(guò)一個(gè)類(lèi)似 Pandas 的接口加載到 GPU 上,然后用于各種連接的機(jī)器學(xué)習(xí)和圖形分析算法,而無(wú)需離開(kāi) GPU。這種級(jí)別的互操作性可通過(guò) Apache Arrow 等庫(kù)實(shí)現(xiàn),并且可加速端到端流程(從數(shù)據(jù)準(zhǔn)備到機(jī)器學(xué)習(xí),再到深度學(xué)習(xí))。

RAPIDS 支持在許多熱門(mén)數(shù)據(jù)科學(xué)庫(kù)之間共享設(shè)備內(nèi)存。這樣可將數(shù)據(jù)保留在 GPU 上,并省去了來(lái)回復(fù)制主機(jī)內(nèi)存的高昂成本。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5063

    瀏覽量

    103446
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8434

    瀏覽量

    132866
  • python
    +關(guān)注

    關(guān)注

    56

    文章

    4804

    瀏覽量

    84910

原文標(biāo)題:NVIDIA 大講堂 | 什么是 Scikit-learn?

文章出處:【微信號(hào):NVIDIA_China,微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    RAG的概念及工作原理

    )與外部知識(shí)源集成,增強(qiáng)了其能力。這種集成允許模型動(dòng)態(tài)地引入相關(guān)信息,使其能夠生成不僅連貫而且事實(shí)準(zhǔn)確、上下文相關(guān)的回應(yīng)。RAG系統(tǒng)的主要組成部分包括: ·檢索器(Retriever): 該組件從外部知識(shí)庫(kù)中獲取相關(guān)數(shù)據(jù)。 ·生成器(Generator):
    的頭像 發(fā)表于 12-17 13:41 ?342次閱讀
    RAG的<b class='flag-5'>概念及</b><b class='flag-5'>工作原理</b>

    自然語(yǔ)言處理與機(jī)器學(xué)習(xí)的關(guān)系 自然語(yǔ)言處理的基本概念及步驟

    Learning,簡(jiǎn)稱ML)是人工智能的一個(gè)核心領(lǐng)域,它使計(jì)算機(jī)能夠從數(shù)據(jù)中學(xué)習(xí)并做出預(yù)測(cè)或決策。自然語(yǔ)言處理與機(jī)器學(xué)習(xí)之間有著密切的關(guān)系,因?yàn)?b class='flag-5'>機(jī)器
    的頭像 發(fā)表于 12-05 15:21 ?599次閱讀

    諧波的概念及應(yīng)用

    本文簡(jiǎn)單介紹了諧波的概念及應(yīng)用。
    的頭像 發(fā)表于 10-18 14:14 ?610次閱讀
    諧波的<b class='flag-5'>概念及</b>應(yīng)用

    RISC-V如何支持不同的AI和機(jī)器學(xué)習(xí)框架和庫(kù)?

    RISC-V如何支持不同的AI和機(jī)器學(xué)習(xí)框架和庫(kù)?還請(qǐng)壇友們多多指教一下。
    發(fā)表于 10-10 22:24

    S參數(shù)的概念及應(yīng)用

    電子發(fā)燒友網(wǎng)站提供《S參數(shù)的概念及應(yīng)用.pdf》資料免費(fèi)下載
    發(fā)表于 08-12 14:29 ?0次下載

    AI訓(xùn)練的基本步驟

    AI(人工智能)訓(xùn)練是一個(gè)復(fù)雜且系統(tǒng)的過(guò)程,它涵蓋了從數(shù)據(jù)收集到模型部署的多個(gè)關(guān)鍵步驟。以下是對(duì)AI訓(xùn)練過(guò)程的詳細(xì)闡述,包括每個(gè)步驟的具體內(nèi)容,并附有相關(guān)代碼示例(以Python和scikit-learn庫(kù)為例)。
    的頭像 發(fā)表于 07-17 16:57 ?2445次閱讀

    八路數(shù)據(jù)分配器的基本概念及工作原理

    八路數(shù)據(jù)分配器是一種常見(jiàn)的電子設(shè)備,用于將一個(gè)輸入信號(hào)分配到多個(gè)輸出端。在本文中,我們將詳細(xì)介紹八路數(shù)據(jù)分配器的基本概念、工作原理、應(yīng)用場(chǎng)景以及設(shè)計(jì)方法。 一、八路數(shù)據(jù)分配器的基本概念 定義:八路
    的頭像 發(fā)表于 07-10 10:40 ?2295次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)的基本概念工作原理

    工作原理,在處理圖像數(shù)據(jù)時(shí)展現(xiàn)出了卓越的性能。本文將從卷積神經(jīng)網(wǎng)絡(luò)的基本概念、結(jié)構(gòu)組成、工作原理以及實(shí)際應(yīng)用等多個(gè)方面進(jìn)行深入解讀。
    的頭像 發(fā)表于 07-02 18:17 ?3969次閱讀

    立柱碼垛機(jī)工作原理

    于物流、制造業(yè)等領(lǐng)域。 ?碼垛機(jī)器人的基本概念工作原理 ?碼垛機(jī)器人是一種高效、精準(zhǔn)的自動(dòng)化設(shè)備,專門(mén)用于在生產(chǎn)線中進(jìn)行產(chǎn)品的擺放和堆疊。它采用先進(jìn)的計(jì)算機(jī)視覺(jué)和運(yùn)動(dòng)控制技術(shù),能夠快
    的頭像 發(fā)表于 06-19 16:05 ?404次閱讀

    機(jī)器視覺(jué)控制器的工作原理與作用

    隨著科技的飛速發(fā)展,機(jī)器視覺(jué)技術(shù)已廣泛應(yīng)用于工業(yè)自動(dòng)化、質(zhì)量檢測(cè)、智能監(jiān)控等領(lǐng)域。機(jī)器視覺(jué)控制器作為機(jī)器視覺(jué)系統(tǒng)的核心部件,其工作原理和作用對(duì)于整個(gè)系統(tǒng)的性能至關(guān)重要。本文將對(duì)
    的頭像 發(fā)表于 06-06 17:37 ?841次閱讀

    RTC實(shí)時(shí)時(shí)鐘的基本概念工作原理

    精確的實(shí)時(shí)時(shí)間,并為電子系統(tǒng)提供精確的時(shí)間基準(zhǔn)。本文將詳細(xì)闡述RTC實(shí)時(shí)時(shí)鐘的基本概念、工作原理以及其在現(xiàn)代電子設(shè)備中的應(yīng)用。
    的頭像 發(fā)表于 05-27 15:43 ?3930次閱讀

    斬波器的基本概念工作原理

    各種電子設(shè)備對(duì)電源的需求。本文將詳細(xì)介紹斬波器的基本概念、工作原理及其應(yīng)用,以期為讀者提供全面的了解和認(rèn)識(shí)。
    的頭像 發(fā)表于 05-24 16:08 ?3386次閱讀

    機(jī)器學(xué)習(xí)入門(mén):基本概念介紹

    機(jī)器學(xué)習(xí)(GraphMachineLearning,簡(jiǎn)稱GraphML)是機(jī)器學(xué)習(xí)的一個(gè)分支,專注于利用圖形結(jié)構(gòu)的數(shù)據(jù)。在圖形結(jié)構(gòu)中,數(shù)據(jù)以圖的形式表示,其中的節(jié)點(diǎn)(或頂點(diǎn))表示實(shí)體
    的頭像 發(fā)表于 05-16 08:27 ?530次閱讀
    圖<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>入門(mén):基本<b class='flag-5'>概念</b>介紹

    低通濾波器的概念、工作原理及分類(lèi)

    在電子信號(hào)處理和通信系統(tǒng)中,濾波器扮演著至關(guān)重要的角色。其中,低通濾波器(Low-pass Filter, LPF)作為一種基礎(chǔ)的電子濾波器,廣泛應(yīng)用于音頻處理、圖像處理、通信系統(tǒng)等多個(gè)領(lǐng)域。本文將對(duì)低通濾波器的概念、工作原理、分類(lèi)、設(shè)計(jì)方法以及應(yīng)用場(chǎng)景進(jìn)行詳細(xì)介紹。
    的頭像 發(fā)表于 05-12 17:43 ?8051次閱讀

    FPGA芯片的工作原理和使用

    FPGA(現(xiàn)場(chǎng)可編程門(mén)陣列)芯片的使用和工作原理對(duì)于初學(xué)者來(lái)說(shuō),可能是一個(gè)相對(duì)復(fù)雜但非常有趣的學(xué)習(xí)領(lǐng)域。
    的頭像 發(fā)表于 03-27 14:59 ?1064次閱讀