0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

7個(gè)強(qiáng)大實(shí)用的Python機(jī)器學(xué)習(xí)庫!

新機(jī)器視覺 ? 來源:今日頭條 ? 2022-12-22 11:03 ? 次閱讀

我們總說“不要重復(fù)發(fā)明輪子”,python 中的第 3 方工具庫就是最好的例子。借助它們,我們可以用簡單的方式編寫復(fù)雜且耗時(shí)的代碼。在本篇內(nèi)容中給大家整理了 7 個(gè)有用的 Python 庫,如果大家從事機(jī)器學(xué)習(xí)工作,一定要來一起了解一下。1.Prophet

Prophet是 Facebook 開源的時(shí)間序列預(yù)測工具庫,基于 Stan 框架,可以自動(dòng)檢測時(shí)間序列中的趨勢、周期性和節(jié)假日效應(yīng),并根據(jù)這些信息進(jìn)行預(yù)測。這個(gè)庫在 GitHub 上有超過 15k 星。

47a532da-8136-11ed-8abf-dac502259ad0.pngProphet 通常用于預(yù)測未來幾個(gè)月、幾年或幾十年的時(shí)間序列數(shù)據(jù),例如銷售額、市場份額等。它提供了 Python 和 R 兩個(gè)版本,可以跨平臺(tái)使用,支持 CPUGPU 的并行運(yùn)算。Prophet 的輸入數(shù)據(jù)格式要求是一個(gè)包含時(shí)間戳和目標(biāo)值的數(shù)據(jù)框,并支持給定時(shí)間范圍、預(yù)測期限和寬限期等參數(shù)進(jìn)行預(yù)測。Prophet 對缺失數(shù)據(jù)和趨勢變化很穩(wěn)健,通常可以很好地處理異常值。

# Pythonforecast = m.predict(future)forecast[['ds', 'yhat', 'yhat_lower', 'yhat_upper']].tail()

47c444b8-8136-11ed-8abf-dac502259ad0.png

2.Deep Lake

Deep Lake是一種數(shù)據(jù)集格式,提供簡單的 API 以用于創(chuàng)建、存儲(chǔ)和協(xié)作處理任何規(guī)模的 AI 數(shù)據(jù)集。這個(gè)庫在 GitHub 上有超過 5k 星。480bd30a-8136-11ed-8abf-dac502259ad0.pngDeep Lake 的數(shù)據(jù)布局可以在大規(guī)模訓(xùn)練模型的同時(shí),實(shí)現(xiàn)數(shù)據(jù)的快速轉(zhuǎn)換和流式傳輸。谷歌、Waymo、紅十字會(huì)、牛津大學(xué)等都在使用 Deep Lake。
for epoch in range(2):    running_loss = 0.0    for i, data in enumerate(deeplake_loader):    images, labels = data['images'], data['labels']     # zero the parameter gradients    optimizer.zero_grad()     # forward + backward + optimize    outputs = net(images)    loss = criterion(outputs, labels.reshape(-1))    loss.backward()    optimizer.step()     # print statistics    running_loss += loss.item()    if i % 100 == 99: #print every 100 mini-batches        print('[%d, %5d] loss: %.3f' %        (epoch + 1, i + 1, running_loss / 100))        running_loss = 0.0

3.Optuna

Optuna 是一個(gè)自動(dòng)機(jī)器學(xué)習(xí)超參數(shù)調(diào)優(yōu)工具,可以幫助用戶通過使用各種規(guī)則自動(dòng)調(diào)整機(jī)器學(xué)習(xí)模型的超參數(shù),以提高模型的性能。這個(gè)庫在 GitHub 上擁有超過 7k 顆星。

4834c7b0-8136-11ed-8abf-dac502259ad0.png

Optuna 使用了貝葉斯優(yōu)化算法來自動(dòng)調(diào)整超參數(shù),并使用基于樹的方法來探索參數(shù)空間。這使得 Optuna 能夠在訓(xùn)練機(jī)器學(xué)習(xí)模型時(shí)自動(dòng)進(jìn)行超參數(shù)調(diào)整,從而提高模型的性能。Optuna 可以與各種機(jī)器學(xué)習(xí)框架集成使用,包括 TensorFlow、PyTorch、XGBoost 等。它還支持多種優(yōu)化目標(biāo),包括最小化損失函數(shù)、最大化準(zhǔn)確率等。總的來說,Optuna是一個(gè)強(qiáng)大的工具,可以幫助用戶提高機(jī)器學(xué)習(xí)模型的性能,提高模型的準(zhǔn)確率。它的易用性和可擴(kuò)展性使它成為機(jī)器學(xué)習(xí)工作流中的一個(gè)重要工具。
import ... # Define an objective function to be minimized.def objective(trial):     # Invoke suggest methods of a Trial object to generate hyperparameters     regressor_name = trial.suggest_categorical('regressor',['SVR', 'RandomForest'])    if regressor_name = 'SVR':        svr_c = trial.suggest_float('svr_c', 1e-10, 1e10, log=True)        regressor_obj = sklearn.svm.SVR(C=svr_c)    else:        rf_max_depth = trial.suggest_int('rf_max_depth', 2, 332)        regressor_obj = sklearn.ensemble.RandomForestRegressor(max_depth=rf_max_depth)     X, y = sklearn.datasets.fetch_california_housing(return_X_y=True)    X_train, X_val, y_train, y_val = sklearn.model_selection.train_test_split(X, y, random_state=0)     regressor_obj.fit(X_train, y_train) y_pred = regressor_obj.predict(X_val)     error = sklearn.metrics.mean_squared_error(y_val, y_pred)     return error # An objective value linked with the Trial object. study = optuna.create_study() # Create a neW studystudy.optimize(objective, n_trials=100) # Invoke opotimization of the objective function

4.pycm

pycm是一個(gè)用于計(jì)算二分類和多分類指標(biāo)的 Python 庫。這個(gè)庫在 GitHub 上有超過 1k 星。

48794bb0-8136-11ed-8abf-dac502259ad0.png

它可以計(jì)算多種常用的指標(biāo),包括準(zhǔn)確率、召回率、F1值、混淆矩陣等。此外,pycm 還提供了一些額外的功能,例如可視化混淆矩陣、評估模型性能的指標(biāo)來源差異等。pycm是一個(gè)非常實(shí)用的庫,可以幫助快速評估模型的性能。

from pycm import *y_actu = [2, 0, 2, 2, 0, 1, 1, 2, 2, 0, 1, 2] y_pred = [0, 0, 2, 1, 0, 2, 1, 0, 2, 2, 2, 2] cm = ConfusionMatrix(actual_vector=y_actu, predict_vector=y_pred) cm.classes cm.print_matrix()  cm.print_normalized_matrix()

5.NannyML

NannyML是一個(gè)開源的 Python 庫,允許估算部署后的模型性能(而無需訪問目標(biāo)),檢測數(shù)據(jù)漂移,并智能地將數(shù)據(jù)漂移警報(bào)鏈接回模型性能的變化。這個(gè)庫在 GitHub 上有超過 1k 星。

488c48f0-8136-11ed-8abf-dac502259ad0.png

為數(shù)據(jù)科學(xué)家設(shè)計(jì)的 NannyML 具有易于使用的交互式可視化界面,目前支持所有表格式的用例(tabular use cases)、分類(classification)和回歸(regression)。NannyML 的核心貢獻(xiàn)者研發(fā)了多種用于估算模型性能的新算法:基于信心的性能估算(CBPE)與直接損失估算(DLE)等。NannyML 通過構(gòu)建“性能監(jiān)控+部署后數(shù)據(jù)科學(xué)”的閉環(huán),使數(shù)據(jù)科學(xué)家能夠快速理解并自動(dòng)檢測靜默模型故障。通過使用 NannyML,數(shù)據(jù)科學(xué)家最終可以保持對他們部署的機(jī)器學(xué)習(xí)模型的完全可見性和信任。

import nannyml as nmlfrom IPython.display import display # Load synthetic data reference, analysis, analysis_target = nml.load_synthnetic_binary_classification_dataset()display(reference.head())display(analysis.head()) # Choose a chunker or set a chunk sizechunk size = 5000 # initialize, specify required data columns,, fit estimator and estimateestimator = nml.CBPE(    y_pred_proba='y_pred_proba',    y_pred='y_pred',    y_true='work_home_actual',    metrics=['roc_auc'],    chunk_size=chunk_size,    problem_type='classification_binary',)estimator = estimator.fit(reference)estimated_performance = estimator.estimate(analysis) # Show resultsfigure = estimated_performance.plot(kind='performance', metric='roc_auc', plot_reference=True)figure.show()

6.ColossalAI

ColossalAI是一個(gè)開源機(jī)器學(xué)習(xí)工具庫,用于構(gòu)建和部署高質(zhì)量的深度學(xué)習(xí)模型。這個(gè)庫在 GitHub 上有超過 6.5k 星。

48ae8492-8136-11ed-8abf-dac502259ad0.png

ColossalAI 提供了一系列預(yù)定義的模型和模型基礎(chǔ)架構(gòu),可用于快速構(gòu)建和訓(xùn)練模型。它還提供了一系列工具,用于模型評估,調(diào)優(yōu)和可視化,以確保模型的高質(zhì)量和準(zhǔn)確性。此外,ColossalAI 還支持部署模型,使其能夠通過各種不同的接口與其他系統(tǒng)集成。ColossalAI 的優(yōu)勢在于它易于使用,可以為數(shù)據(jù)科學(xué)家和機(jī)器學(xué)習(xí)工程師提供快速和有效的方法來構(gòu)建和部署高質(zhì)量的大型模型。

from colossalai.logging import get_dist_loggerfrom colossalai.trainer import Trainer, hooks # build components and initialize with colossaalai.initialize... # create a logger so that trainer can log on thhe consolelogger = get_dist_logger() # create a trainer objecttrainer = Trainer(    engine=engine,    logger=logger)

7.emcee

emcee是一個(gè)開源的 Python 庫,用于使用 Markov chain Monte Carlo(MCMC)方法進(jìn)行模型擬合和參數(shù)估計(jì)。這個(gè)庫在 GitHub 上有超過 1k 星。

48fbb92e-8136-11ed-8abf-dac502259ad0.png

emcee 是面向?qū)ο蟮?,并且具有用于診斷和調(diào)試擬合過程的許多工具。它使用了一種叫做"決策樹結(jié)構(gòu)鏈"的方法,可以并行化擬合過程,提高擬合效率。emcee 非常適合處理復(fù)雜的非線性模型,并且可以輕松擴(kuò)展到大型數(shù)據(jù)集。它也可以輕松與其他 Python 庫集成,如 NumPy、SciPy和Matplotlib。
import numpy as npimport emcee def log_prob(x, ivar):    return -0.5 * np.sum(ivar * x ** 2)  ndim, nwalkers = 5, 100 ivar = 1./np.random.rand(ndim)p0 = np.random.randn(nwalkers, ndim) sampler = emcee.EnsembleSampler(nwalkers, ndim, log_prob, args=[ivar])sampler.run_mcmc(p0, 10000)

總結(jié)

以上就是給大家做的工具庫介紹,這7個(gè)工具庫都是非常有用的,對于機(jī)器學(xué)習(xí)工作者來說,它們可以大大提高工作效率,讓你能夠在簡單的方式下編寫復(fù)雜的代碼。所以,如果你還沒有了解這些工具庫的話,不妨花一點(diǎn)時(shí)間來了解一下。

審核編輯 :李倩


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8438

    瀏覽量

    132972
  • python
    +關(guān)注

    關(guān)注

    56

    文章

    4807

    瀏覽量

    84975
  • GitHub
    +關(guān)注

    關(guān)注

    3

    文章

    473

    瀏覽量

    16534

原文標(biāo)題:【推薦】7個(gè)強(qiáng)大實(shí)用的Python機(jī)器學(xué)習(xí)庫!

文章出處:【微信號(hào):vision263com,微信公眾號(hào):新機(jī)器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    傳統(tǒng)機(jī)器學(xué)習(xí)方法和應(yīng)用指導(dǎo)

    用于開發(fā)生物學(xué)數(shù)據(jù)的機(jī)器學(xué)習(xí)方法。盡管深度學(xué)習(xí)(一般指神經(jīng)網(wǎng)絡(luò)算法)是一個(gè)強(qiáng)大的工具,目前也非常流行,但它的應(yīng)用領(lǐng)域仍然有限。與深度
    的頭像 發(fā)表于 12-30 09:16 ?359次閱讀
    傳統(tǒng)<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>方法和應(yīng)用指導(dǎo)

    個(gè)月速成python+OpenCV圖像處理

    OpenCV是一個(gè)廣受歡迎且極為流行的計(jì)算機(jī)視覺,它因其強(qiáng)大的功能、靈活性和開源特性而在開發(fā)者和研究者中備受青睞。學(xué)習(xí)OpenCV主要就是學(xué)習(xí)
    的頭像 發(fā)表于 11-29 18:27 ?188次閱讀
    一<b class='flag-5'>個(gè)</b>月速成<b class='flag-5'>python</b>+OpenCV圖像處理

    如何使用Python構(gòu)建LSTM神經(jīng)網(wǎng)絡(luò)模型

    : NumPy:用于數(shù)學(xué)運(yùn)算。 TensorFlow:一個(gè)開源機(jī)器學(xué)習(xí),Keras是其高級API。 Keras:用于構(gòu)建和訓(xùn)練深度學(xué)習(xí)模型
    的頭像 發(fā)表于 11-13 10:10 ?546次閱讀

    RISC-V如何支持不同的AI和機(jī)器學(xué)習(xí)框架和

    RISC-V如何支持不同的AI和機(jī)器學(xué)習(xí)框架和?還請壇友們多多指教一下。
    發(fā)表于 10-10 22:24

    如何幫助孩子高效學(xué)習(xí)Python:開源硬件實(shí)踐是最優(yōu)選擇

    家長們常常擔(dān)心孩子在學(xué)習(xí)Python時(shí)所面臨的挑戰(zhàn),如復(fù)雜性、興趣保持、學(xué)習(xí)進(jìn)度和可用資源。對于希望有效教授孩子Python的家長而言,了解硬件的作用至關(guān)重要,因?yàn)榻Y(jié)合硬件項(xiàng)目的
    的頭像 發(fā)表于 09-06 09:49 ?359次閱讀

    【「時(shí)間序列與機(jī)器學(xué)習(xí)」閱讀體驗(yàn)】時(shí)間序列的信息提取

    個(gè)重要環(huán)節(jié),目標(biāo)是從給定的時(shí)間序列數(shù)據(jù)中提取出有用的信息和特征,以支持后續(xù)的分析和預(yù)測任務(wù)。 特征工程(Feature Engineering)是將數(shù)據(jù)轉(zhuǎn)換為更好地表示潛在問題的特征,從而提高機(jī)器學(xué)習(xí)
    發(fā)表于 08-17 21:12

    【《時(shí)間序列與機(jī)器學(xué)習(xí)》閱讀體驗(yàn)】+ 時(shí)間序列的信息提取

    本人有些機(jī)器學(xué)習(xí)的基礎(chǔ),理解起來一點(diǎn)也不輕松,加油。 作者首先說明了時(shí)間序列的信息提取是時(shí)間序列分析的一個(gè)重要環(huán)節(jié),目標(biāo)是從給定的時(shí)間序列數(shù)據(jù)中提取出有用的信息和特征,以支持后續(xù)的分析和預(yù)測任務(wù),可以
    發(fā)表于 08-14 18:00

    pytorch和python的關(guān)系是什么

    在當(dāng)今的人工智能領(lǐng)域,Python已經(jīng)成為了最受歡迎的編程語言之一。Python的易學(xué)易用、豐富的和框架以及強(qiáng)大的社區(qū)支持,使其成為了數(shù)據(jù)科學(xué)、機(jī)
    的頭像 發(fā)表于 08-01 15:27 ?2229次閱讀

    Python在AI中的應(yīng)用實(shí)例

    Python在人工智能(AI)領(lǐng)域的應(yīng)用極為廣泛且深入,從基礎(chǔ)的數(shù)據(jù)處理、模型訓(xùn)練到高級的應(yīng)用部署,Python都扮演著至關(guān)重要的角色。以下將詳細(xì)探討Python在AI中的幾個(gè)關(guān)鍵應(yīng)用實(shí)例,包括
    的頭像 發(fā)表于 07-19 17:16 ?1315次閱讀

    Python自動(dòng)訓(xùn)練人工神經(jīng)網(wǎng)絡(luò)

    人工神經(jīng)網(wǎng)絡(luò)(ANN)是機(jī)器學(xué)習(xí)中一種重要的模型,它模仿了人腦神經(jīng)元的工作方式,通過多層節(jié)點(diǎn)(神經(jīng)元)之間的連接和權(quán)重調(diào)整來學(xué)習(xí)和解決問題。Python由于其
    的頭像 發(fā)表于 07-19 11:54 ?400次閱讀

    opencv-python和opencv一樣嗎

    不一樣。OpenCV(Open Source Computer Vision Library)是一個(gè)開源的計(jì)算機(jī)視覺和機(jī)器學(xué)習(xí)軟件,它提供了大量的圖像和視頻處理功能。OpenCV-
    的頭像 發(fā)表于 07-16 10:38 ?1368次閱讀

    基于Python的深度學(xué)習(xí)人臉識(shí)別方法

    基于Python的深度學(xué)習(xí)人臉識(shí)別方法是一個(gè)涉及多個(gè)技術(shù)領(lǐng)域的復(fù)雜話題,包括計(jì)算機(jī)視覺、深度學(xué)習(xí)、以及圖像處理等。在這里,我將概述一個(gè)基本的
    的頭像 發(fā)表于 07-14 11:52 ?1314次閱讀

    深度學(xué)習(xí)常用的Python

    深度學(xué)習(xí)作為人工智能的一個(gè)重要分支,通過模擬人類大腦中的神經(jīng)網(wǎng)絡(luò)來解決復(fù)雜問題。Python作為一種流行的編程語言,憑借其簡潔的語法和豐富的支持,成為了深度
    的頭像 發(fā)表于 07-03 16:04 ?698次閱讀

    如何使用Python進(jìn)行神經(jīng)網(wǎng)絡(luò)編程

    神經(jīng)網(wǎng)絡(luò)簡介 神經(jīng)網(wǎng)絡(luò)是一種受人腦啟發(fā)的機(jī)器學(xué)習(xí)模型,由大量的節(jié)點(diǎn)(或稱為“神經(jīng)元”)組成,這些節(jié)點(diǎn)在網(wǎng)絡(luò)中相互連接。每個(gè)節(jié)點(diǎn)可以接收輸入,對輸入進(jìn)行加權(quán)求和,然后通過一個(gè)激活函數(shù)產(chǎn)生輸出
    的頭像 發(fā)表于 07-02 09:58 ?447次閱讀

    ESP32下如何加自定義Python

    我看官方有提供Micropython的bin文件,但我想根據(jù)自己外設(shè)擴(kuò)充一下Python,這個(gè)應(yīng)該從哪里入手? 之前做過RTT系統(tǒng)的python擴(kuò)充,RTT有提供Micropyth
    發(fā)表于 06-18 06:27