0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

多元線性回歸數(shù)據(jù)集(50_Startups.csv)及代碼實現(xiàn)

jf_R6cs0Kjv ? 來源:智行RFID ? 2023-08-04 10:32 ? 次閱讀

知識點離散數(shù)據(jù)的處理

若數(shù)據(jù)存在“序”關系則連續(xù)化,如:

離散 連續(xù)
高/m
10 1
5 0.5
1 0

否則,轉(zhuǎn)為K維向量代碼可見本實例中的Pd.get_dummies(X['state'])。但要注意虛擬變量,例如“性別”變量,可虛擬出“男”和”女”兩個變量,

1 0
0 1

這里所說的虛擬變量陷阱是兩個或多個變量高度相關的情況,簡單地說,一個變量可以從其他變量中預測出來,那么這里就有一個重復的類別,可以去掉一個變量,節(jié)約內(nèi)存計算機內(nèi)存空間,減少計算量。

本實例用的數(shù)據(jù)集是50_Startups.csv,

代碼如下:

importnumpyasnp
pipinstallmatplotlib
importmatplotlib.pyplotasplt
importpandasaspd
dataset=pd.read_csv("D:/python/50.csv")
X=dataset.iloc[:,0:4]#0到3列的所有行數(shù)據(jù)(共4列)
X["State"].unique()
y=dataset.iloc[:,4]#第5列的所有行數(shù)據(jù)
pd.get_dummies(X['State'])#離散數(shù)據(jù)轉(zhuǎn)為K維向量
statesdump=pd.get_dummies(X['State'],drop_first=True)#去掉X['State']的第一列數(shù)據(jù)(減少虛擬變量)
X=X.drop('State',axis=1)
X=pd.concat([X,statesdump],axis=1)
from sklearn.model_selection import train_test_split
x_train,x_test,y_train,y_test=train_test_split(X,y,test_size=0.3,random_state=0)
x_train
#引入線性回歸模型擬合訓練集
from sklearn.linear_model import LinearRegression
regressor=LinearRegression()
model=regressor.fit(x_train,y_train)
#預測測試集的結(jié)果
y_predict=regressor.predict(x_test)
from sklearn.metrics import r2_score# 
score1=r2_score(y_test,y_predict)
model.coef_#多元函數(shù)的系數(shù)
model.intercept_#函數(shù)的截距
model.score(X,y)





審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 向量機
    +關注

    關注

    0

    文章

    166

    瀏覽量

    20883
  • 虛擬機
    +關注

    關注

    1

    文章

    917

    瀏覽量

    28221
  • 機器學習
    +關注

    關注

    66

    文章

    8420

    瀏覽量

    132687
  • python
    +關注

    關注

    56

    文章

    4797

    瀏覽量

    84729
  • 線性回歸
    +關注

    關注

    0

    文章

    41

    瀏覽量

    4308

原文標題:機器學習-多元線性回歸數(shù)據(jù)集(50_Startups.csv)及代碼實現(xiàn)

文章出處:【微信號:智行RFID,微信公眾號:智行RFID】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關推薦

    matlab回歸分析總結(jié)

    1、多元線性回歸2、多項式回歸3、非線性回歸4、逐步回歸[hide][/hide]
    發(fā)表于 03-20 10:26

    線性回歸的標準方程法使用

    線性回歸-標準方程法示例(python原生實現(xiàn)
    發(fā)表于 05-07 16:44

    機器學習100天之多元線性回歸

    機器學習100天-多元線性回歸 [代碼實現(xiàn)細節(jié)分析]
    發(fā)表于 05-12 15:06

    簡單線性回歸代碼實現(xiàn)細節(jié)分析

    機器學習100天-簡單線性回歸 [代碼實現(xiàn)細節(jié)分析]
    發(fā)表于 05-22 10:16

    回歸算法有哪些,常用回歸算法(3種)詳解

    因變量和自變量之間的關系實現(xiàn)數(shù)據(jù)的預測。例如,對房價估計時,需要確定房屋面積(自變量)與其價格(因變量)之間的關系,可以利用這一關系來預測給定面積的房屋的價格。可以有多個影響因變量的自變量。因此,回歸
    發(fā)表于 07-28 14:36

    TensorFlow csv文件讀取數(shù)據(jù)代碼實現(xiàn))詳解

    大多數(shù)人了解 Pandas 及其在處理大數(shù)據(jù)文件方面的實用性。TensorFlow 提供了讀取這種文件的方法。前面章節(jié)中,介紹了如何在 TensorFlow 中讀取文件,本節(jié)將重點介紹如何從 CSV
    發(fā)表于 07-28 14:40

    TensorFlow實現(xiàn)簡單線性回歸

    本小節(jié)直接從 TensorFlow contrib 數(shù)據(jù)加載數(shù)據(jù)。使用隨機梯度下降優(yōu)化器優(yōu)化單個訓練樣本的系數(shù)。實現(xiàn)簡單線性
    發(fā)表于 08-11 19:34

    TensorFlow實現(xiàn)多元線性回歸(超詳細)

    。這里是波士頓房價數(shù)據(jù)的多重線性回歸代碼,使用 13 個輸入特征。波士頓房價數(shù)據(jù)
    發(fā)表于 08-11 19:35

    TensorFlow邏輯回歸處理MNIST數(shù)據(jù)

    本節(jié)基于回歸學習對 MNIST 數(shù)據(jù)進行處理,但將添加一些 TensorBoard 總結(jié)以便更好地理解 MNIST 數(shù)據(jù)。MNIST由h
    發(fā)表于 08-11 19:36

    TensorFlow邏輯回歸處理MNIST數(shù)據(jù)

    本節(jié)基于回歸學習對 MNIST 數(shù)據(jù)進行處理,但將添加一些 TensorBoard 總結(jié)以便更好地理解 MNIST 數(shù)據(jù)。MNIST由h
    發(fā)表于 08-11 19:36

    如何用C語言實現(xiàn)一個簡單的一元線性回歸算法

    今天我們用C語言實現(xiàn)一個簡單的線性回歸算法;在代碼前面我們在回顧一下線性回歸。
    發(fā)表于 07-20 06:34

    使用PyMC3包實現(xiàn)貝葉斯線性回歸

    1、如何使用PyMC3包實現(xiàn)貝葉斯線性回歸  PyMC3(現(xiàn)在簡稱為PyMC)是一個貝葉斯建模包,它使數(shù)據(jù)科學家能夠輕松地進行貝葉斯推斷。  PyMC3采用馬爾可夫鏈蒙特卡羅(MCMC
    發(fā)表于 10-08 15:59

    基于多元線性回歸的阻性和容性電流分解

    基于多元線性回歸的阻性和容性電流分解_韓永森
    發(fā)表于 01-07 17:16 ?2次下載

    基于Weierstrass逼近定理在非線性回歸模型中應用

    基于Weierstrass逼近定理,闡釋了將一般非線性回歸模型近似為多項式模型來處理的數(shù)學原理,從而引入了把多元線性回歸分析轉(zhuǎn)化為多元線性
    發(fā)表于 01-12 09:59 ?0次下載

    多元線性回歸的特點是什么

    何為多元線性回歸?對比于前一天學習的線性回歸,多元線性
    的頭像 發(fā)表于 10-31 10:34 ?1462次閱讀
    <b class='flag-5'>多元</b><b class='flag-5'>線性</b><b class='flag-5'>回歸</b>的特點是什么