0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

機器學習筆記之高斯過程(上)

jf_78858299 ? 來源:人工智能大講堂 ? 作者:人工智能大講堂 ? 2023-05-30 16:49 ? 次閱讀

高斯分布

我們定義一個將輸入x映射到輸出y的函數(shù)圖片,在統(tǒng)計學中,我們使用隨機模型來定義這種關系的概率分布。例如,一個3.8 GPA的學生可以獲得平均$60K的薪水,方差(σ2)為$10K。

圖片

p(Salary=x|GPA=3.8)(一個均值為$60K,方差為$10k的高斯分布)

概率密度函數(shù)(Probability density function,PDF)

在下面的圖表中,p(X=x) 服從高斯分布:

圖片

圖片

在高斯分布中,68%的數(shù)據(jù)在距離μ 1σ之內(nèi),95%的數(shù)據(jù)在距離μ 2σ之內(nèi)。我們可以根據(jù)概率分布來進行數(shù)據(jù)采樣。從分布圖片中采樣數(shù)據(jù)的符號表示為:

圖片

在現(xiàn)實生活中,許多數(shù)據(jù)都遵循高斯分布。

例如,讓我們建立舊金山居民身高和體重之間的關系模型。我們從1000名成年居民中收集信息,并將數(shù)據(jù)繪制如下圖所示,每個紅點代表1個人:

圖片

對應的三維概率密度函數(shù)(PDF)如下圖所示:

圖片

讓我們首先將模型推廣到多元高斯分布,即概率密度函數(shù)取決于多個變量。

一個多元向量:

圖片

多元高斯分布的概率密度函數(shù)定義如下:

圖片

其中,Σ表示協(xié)方差矩陣:

圖片

讓我們回到身高和體重的例子中,來說明這個公式的應用。

圖片

從我們的訓練數(shù)據(jù)中,我們計算得到圖片=190,圖片=70:

圖片

協(xié)方差矩陣Σ是用來做什么的?協(xié)方差矩陣中的每個元素都代表著兩個變量之間的關系。例如,圖片表示身高(圖片)與體重(圖片)的相關性。如果體重隨身高的增加而增加,那么圖片為正值。

圖片

讓我們詳細介紹如何計算上述的圖片。為了簡化,我們假設我們只有兩個數(shù)據(jù)點(150磅,66英寸)和(200磅,72英寸)。

圖片

在計算了所有1000個數(shù)據(jù)之后,協(xié)方差矩陣Σ的值如下所示:

圖片

協(xié)方差矩陣Σ中的正元素值表示兩個變量呈正相關關系。不出所料,圖片是正值,因為體重隨身高的增加而增加。如果兩個變量彼此獨立,則值應為0,如下所示:

圖片

計算圖片的概率

計算在給定圖片的條件下圖片的概率:

圖片

其中,Φ是累積分布函數(shù)(cumulative distribution function,CDF):

圖片

我們將協(xié)方差變量Σ重寫為以下形式:

圖片

代碼

我們從一個二元高斯分布中采樣數(shù)據(jù)。從協(xié)方差矩陣中,我們可以看出x和y呈正相關關系,因為圖片圖片是正的。

mean = [0, 2]
cov = [[1, 2], [3, 1]]


x, y = np.random.multivariate_normal(mean, cov, 5000).T
plt.plot(x, y, 'x')
plt.axis('equal')
plt.show()

圖片

下面繪制(y,x)的概率分布圖:

from scipy.stats import multivariate_normal


x, y = np.mgrid[-1:1:.01, -1:1:.01]  # x (200, 200) y (200, 200)
pos = np.empty(x.shape + (2,))
pos[:, :, 0] = x; pos[:, :, 1] = y   # pos (200, 200, 2)


mean = [-0.4, -0.3]
cov = [[2.1, 0.2], [0.4, 0.5]]
rv = multivariate_normal(mean, cov)
p = rv.pdf(pos)                      # (200, 200)
plt.contourf(x, y, p)
plt.show()

圖片

多元高斯分布定理

給定一個高斯分布:

圖片

后驗條件概率圖片的計算公式如下所示。這個公式在后面的高斯過程中非常重要。例如,如果我們有1000個畢業(yè)生的GPA和薪水樣本,我們可以使用這個定理通過1000個訓練數(shù)據(jù)點創(chuàng)建一個高斯分布模型來預測給定GPA情況下的薪水P(salary|GPA),

這里不詳細介紹公式的推理過程。但是假設x服從高斯分布。圖片圖片之間的相關性由μ和Σ定義。因此,給定圖片的值,我們可以計算出圖片的概率分布:p(圖片|圖片)。

圖片

例如,我們知道舊金山居民的身高服從高斯分布。在下一節(jié)中,我們將應用高斯過程來預測在給定身高的情況下體重的值。

高斯過程

高斯過程(Gaussian Process,GP)的直觀理解很簡單。如果兩個點具有相似的輸入,那么它們的輸出也應該相似。對于有兩個數(shù)據(jù)點的情況,如果一個數(shù)據(jù)點比另一個數(shù)據(jù)點更接近已知的訓練數(shù)據(jù)點,那么它的預測結(jié)果會更加可靠。

例如,如果一個GPA為3.5的學生一年掙$70K,那么另一個GPA為3.45的學生應該會掙類似的薪水。在高斯過程中,我們使用訓練數(shù)據(jù)集來構(gòu)建高斯分布,以進行預測。對于每個預測,我們輸出一個均值和一個σ。例如,使用高斯過程,我們可以預測一個GPA為3.3的學生可以掙到μ=$65K,σ=$5K,而一個GPA為2.5的學生可以掙到μ=$50K和σ=$15K。σ衡量了我們預測的不確定性。因為3.3 GPA更接近于我們的3.5 GPA訓練數(shù)據(jù),所以我們對于3.3 GPA學生的薪水預測比2.5 GPA學生更有信心。

在高斯過程中,我們不是計算Σ,而是計算K來衡量數(shù)據(jù)點圖片圖片之間的相似性。

圖片

其中,核函數(shù)k是一個度量兩個數(shù)據(jù)點相似性的函數(shù)(值為1表示相同)。有許多可能的核函數(shù),我們將使用指數(shù)平方距離作為核函數(shù)。

圖片

注意:上面的圖片表示數(shù)據(jù)點的體重。圖片表示數(shù)據(jù)點1。

有了所有的訓練數(shù)據(jù),我們可以創(chuàng)建一個高斯模型:

圖片

讓我們再次用兩個訓練數(shù)據(jù)點(150磅,66英寸)和(200磅,72英寸)來演示。這里我們正在為我們的訓練數(shù)據(jù)構(gòu)建一個高斯模型。

圖片

其中175是體重的平均值,圖片衡量了數(shù)據(jù)點圖片圖片之間身高的相似性。上面的符號表示我們可以在體重上采樣一個向量f。

圖片

從由數(shù)據(jù)點(150,66)和(200,72)建模的圖片中進行采樣。

現(xiàn)在假設我們要預測輸入圖片,圖片時的圖片,圖片。模型變?yōu)椋?/p>

圖片

讓我們再次理解一下這是什么意思。例如,我們有一個包含4個人身高的向量:

圖片

我們可以使用圖片來采樣這些人可能的體重:

圖片

我們知道前兩個值來自訓練數(shù)據(jù),我們嘗試計算出圖片圖片的分布(它們的μ和σ是多少)?,F(xiàn)在,我們不僅可以預測2個值,還可以對一系列輸入值進行預測。

圖片

然后使用圖片來采樣向量:

圖片

例如,我們從圖片中采樣的第一個輸出樣本是:

圖片

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 函數(shù)
    +關注

    關注

    3

    文章

    4340

    瀏覽量

    62791
  • 隨機
    +關注

    關注

    0

    文章

    12

    瀏覽量

    9741
  • 映射
    +關注

    關注

    0

    文章

    47

    瀏覽量

    15851
  • 高斯分布
    +關注

    關注

    0

    文章

    6

    瀏覽量

    2764
收藏 人收藏

    評論

    相關推薦

    機器學習基石筆記

    3)機器學習基石筆記 Lecture3:Types of Learning
    發(fā)表于 05-26 14:53

    吳恩達機器學習筆記分享

    吳恩達機器學習筆記 —— 1 緒論:初識機器學習
    發(fā)表于 06-05 17:42

    機器學習筆記之BP推導

    機器學習筆記:BP推導
    發(fā)表于 06-15 17:11

    高斯過程回歸GPR和多任務高斯過程MTGP

    文章目錄高斯過程回歸多任務高斯過程文獻閱讀文獻[1]文獻[2]文獻[3]文獻[4]文獻[5]文獻[6]編程實現(xiàn)參考文獻和資料本文介紹了高斯
    發(fā)表于 06-30 06:59

    基于高斯過程回歸學習的頻譜分配算法

    針對認知無線網(wǎng)絡中認知用戶的頻譜分配問題,提出了一種基于拍賣理論和高斯過程回歸學習的頻譜分配算法。該算法基于VCG拍賣模型,考慮認知用戶對通信質(zhì)量的要求,構(gòu)造出更有效的收益函數(shù)。在頻譜拍賣過程
    發(fā)表于 11-30 10:40 ?0次下載
    基于<b class='flag-5'>高斯</b><b class='flag-5'>過程</b>回歸<b class='flag-5'>學習</b>的頻譜分配算法

    機器學習的個人學習筆記

    本文檔的主要內(nèi)容詳細介紹的是機器學習的個人學習筆記免費下載。
    發(fā)表于 03-01 09:28 ?22次下載
    <b class='flag-5'>機器</b><b class='flag-5'>學習</b>的個人<b class='flag-5'>學習</b><b class='flag-5'>筆記</b>

    python機器學習筆記資料免費下載

    本文檔的主要內(nèi)容詳細介紹的是python機器學習筆記資料免費python機器學習筆記資料免費下載
    發(fā)表于 03-01 10:09 ?39次下載

    什么是高斯過程 神經(jīng)網(wǎng)絡高斯過程解析

    神經(jīng)網(wǎng)絡是怎么和高斯過程聯(lián)系在一起的呢?Lee et al. [1] and Neal [2] 指出,隨機初始化無限寬網(wǎng)絡的參數(shù)會產(chǎn)生一個高斯過程,稱作神經(jīng)網(wǎng)絡
    發(fā)表于 08-10 11:25 ?4450次閱讀

    機器學習筆記之高斯過程(下)

    高斯分布 我們定義一個將輸入x映射到輸出y的函數(shù)圖片,在統(tǒng)計學中,我們使用隨機模型來定義這種關系的概率分布。例如,一個3.8 GPA的學生可以獲得平均$60K的薪水,方差(σ2)為$10K
    的頭像 發(fā)表于 05-30 16:50 ?1506次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>學習</b><b class='flag-5'>筆記</b><b class='flag-5'>之高斯</b><b class='flag-5'>過程</b>(下)

    PyTorch教程18.1之高斯過程簡介

    電子發(fā)燒友網(wǎng)站提供《PyTorch教程18.1之高斯過程簡介.pdf》資料免費下載
    發(fā)表于 06-05 10:46 ?0次下載
    PyTorch教程18.1<b class='flag-5'>之高斯</b><b class='flag-5'>過程</b>簡介

    PyTorch教程18.2之高斯過程先驗

    電子發(fā)燒友網(wǎng)站提供《PyTorch教程18.2之高斯過程先驗.pdf》資料免費下載
    發(fā)表于 06-05 10:47 ?0次下載
    PyTorch教程18.2<b class='flag-5'>之高斯</b><b class='flag-5'>過程</b>先驗

    PyTorch教程18.3之高斯過程推理

    電子發(fā)燒友網(wǎng)站提供《PyTorch教程18.3之高斯過程推理.pdf》資料免費下載
    發(fā)表于 06-05 10:48 ?0次下載
    PyTorch教程18.3<b class='flag-5'>之高斯</b><b class='flag-5'>過程</b>推理

    PyTorch教程-18.1. 高斯過程簡介

    SageMaker Studio Lab 中打開筆記本 在許多情況下,機器學習相當于從數(shù)據(jù)中估計參數(shù)。這些參數(shù)通常很多且相對難以解釋——例如神經(jīng)網(wǎng)絡的權重。相比之下,高斯
    的頭像 發(fā)表于 06-05 15:44 ?894次閱讀
    PyTorch教程-18.1. <b class='flag-5'>高斯</b><b class='flag-5'>過程</b>簡介

    PyTorch教程-18.2. 高斯過程先驗

    SageMaker Studio Lab 中打開筆記本 了解高斯過程 (GP) 對于推理模型構(gòu)建和泛化以及在各種應用中實現(xiàn)最先進的性能非常重要,包括主動學習和深度
    的頭像 發(fā)表于 06-05 15:44 ?855次閱讀
    PyTorch教程-18.2. <b class='flag-5'>高斯</b><b class='flag-5'>過程</b>先驗

    PyTorch教程-18.3。高斯過程推理

    18.3。高斯過程推理? Colab [火炬]在 Colab 中打開筆記本 Colab [mxnet] Open the notebook in Colab Colab [jax
    的頭像 發(fā)表于 06-05 15:44 ?1077次閱讀
    PyTorch教程-18.3。<b class='flag-5'>高斯</b><b class='flag-5'>過程</b>推理