0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

深度學(xué)習(xí)算法背后的數(shù)學(xué)

zhKF_jqr_AI ? 來源:未知 ? 作者:胡薇 ? 2018-06-01 11:38 ? 次閱讀

Python軟件基金會成員(Contibuting Member)Vihar Kurama簡要介紹了深度學(xué)習(xí)算法背后的數(shù)學(xué)。

深度學(xué)習(xí)(Deep Learning)是機器學(xué)習(xí)的子領(lǐng)域。而線性代數(shù)(linear algebra)是有關(guān)連續(xù)值的數(shù)學(xué)。許多計算機科學(xué)家在此方面經(jīng)驗不足(傳統(tǒng)上計算機科學(xué)更偏重離散數(shù)學(xué))。想要理解和使用許多機器學(xué)習(xí)算法,特別是深度學(xué)習(xí)算法,對線性代數(shù)的良好理解是不可或缺的。

為什么要學(xué)數(shù)學(xué)?

線性代數(shù)、概率論和微積分是確切地表達機器學(xué)習(xí)的“語言”。學(xué)習(xí)這些主題有助于形成對機器學(xué)習(xí)算法底層機制的深入理解,也有助于開發(fā)新的算法。

如果我們查看的尺度足夠小,那么深度學(xué)習(xí)背后的一切都是數(shù)學(xué)。所以在開始深度學(xué)習(xí)之前,有必要理解基本的線性代數(shù)。

標(biāo)量、向量、矩陣、張量;圖片來源:hadrienj.github.io

深度學(xué)習(xí)背后的核心數(shù)據(jù)結(jié)構(gòu)是標(biāo)量(Scalar)、向量(Vector)、矩陣(Matrix)、張量(Tensor)。讓我們通過編程,使用這些數(shù)據(jù)結(jié)構(gòu)求解基本的線性代數(shù)問題。

標(biāo)量

標(biāo)量是單個數(shù)字,或者說,0階(0th-order)張量。x ∈ ?表示x是一個屬于實數(shù)集?的標(biāo)量。

在深度學(xué)習(xí)中,有不同的數(shù)字集合。?表示正整數(shù)集(1,2,3,…)。?表示整數(shù)集,包括正數(shù)、負數(shù)和零。?表示有理數(shù)集(可以表達為兩個整數(shù)之比的數(shù))。

在Python中有幾個內(nèi)置的標(biāo)量類型:int、float、complex、bytes、Unicode。Numpy又增加了二十多個新的標(biāo)量類型。

import numpy as np

np.ScalarType

返回:

(int,

float,

complex,

int,

bool,

bytes,

str,

memoryview,

numpy.bool_,

numpy.int8,

numpy.uint8,

numpy.int16,

numpy.uint16,

numpy.int32,

numpy.uint32,

numpy.int64,

numpy.uint64,

numpy.int64,

numpy.uint64,

numpy.float16,

numpy.float32,

numpy.float64,

numpy.float128,

numpy.complex64,

numpy.complex128,

numpy.complex256,

numpy.object_,

numpy.bytes_,

numpy.str_,

numpy.void,

numpy.datetime64,

numpy.timedelta64)

其中,以下劃線(_)結(jié)尾的數(shù)據(jù)類型和對應(yīng)的Python內(nèi)置類型基本上是等價的。

在Python中定義標(biāo)量和一些運算

下面的代碼演示了一些張量的算術(shù)運算。

a = 5

b = 7.5

print(type(a))

print(type(b))

print(a + b)

print(a - b)

print(a * b)

print(a / b)

輸出:

12.5

-2.5

37.5

0.6666666666666666

下面的代碼段檢查給定的變量是否是標(biāo)量:

import numpy as np

def isscalar(num):

if isinstance(num, generic):

returnTrue

else:

returnFalse

print(np.isscalar(3.1))

print(np.isscalar([3.1]))

print(np.isscalar(False))

輸出:

True

False

True

向量

向量是由單個數(shù)字組成的有序數(shù)組,或者說,1階張量。向量是向量空間這一對象的組成部分。向量空間是特定長度(又叫維度)的所有可能的向量的整個集合。三維實數(shù)向量空間(?3)常用于表示現(xiàn)實世界中的三維空間。

為了指明向量的分量(component),向量的第i個標(biāo)量元素記為x[i]。

在深度學(xué)習(xí)中,向量通常用來表示特征向量。

在Python中定義向量和一些運算

聲明向量:

x = [1, 2, 3]

y = [4, 5, 6]

print(type(x))

輸出:

+并不表示向量的加法,而是列表的連接:

print(x + y)

輸出:

[1, 2, 3, 4, 5, 6]

需要使用Numpy進行向量加法:

z = np.add(x, y)

print(z)

print(type(z))

輸出:

[579]

向量的叉積(cross product)

兩個向量的叉積向量,大小等于以這兩個向量為鄰邊的平行四邊形面積,方向與這兩個向量所在平面垂直:

圖片來源:維基百科

np.cross(x, y)

返回:

[-36 -3]

向量的點積(dot product)

向量的點積為標(biāo)量,對于給定長度但方向不同的兩個向量而言,方向差異越大,點積越小。

圖片來源:betterexplained.com

np.dot(x, y)

返回:

32

矩陣

矩陣是由數(shù)字組成的矩形數(shù)組,或者說,2階張量。如果m和n為正整數(shù),即,m, n ∈ ?,那么,一個m x n矩陣包含m * n個數(shù)字,m行n列。

m x n可表示為以下形式:

有時簡寫為:

在Python中定義矩陣和一些運算

在Python中,我們使用numpy庫創(chuàng)建n維數(shù)組,也就是矩陣。我們將列表傳入matrix方法,以定義矩陣。

x = np.matrix([[1,2],[3,4]])

x

返回:

matrix([[1, 2],

[3, 4]])

矩陣第0軸的元素均值:

x.mean(0)

返回:

matrix([[2., 3.]]) # (1+3)/2, (3+4)/2

矩陣第1軸的元素均值:

x.mean(1)

返回:

z = x.mean(1)

z

返回:

matrix([[1.5], # (1+2)/2

[3.5]]) # (3+4)/2

shape屬性返回矩陣的形狀:

z.shape

返回:

(2, 1)

所以,矩陣z有2行1列。

順便提下,向量的shape屬性返回由單個數(shù)字(向量的長度)組成的元組:

np.shape([1, 2, 3])

返回:

(3,)

而標(biāo)量的shape屬性返回一個空元祖:

np.shape(1)

返回:

()

矩陣加法和乘法

矩陣可以和標(biāo)量及其他矩陣相加、相乘。這些運算在數(shù)學(xué)上都有精確的定義。機器學(xué)習(xí)和深度學(xué)習(xí)經(jīng)常使用這些運算,所以有必要熟悉這些運算。

對矩陣求和:

x = np.matrix([[1, 2], [4, 3]])

x.sum()

返回:

10

矩陣-標(biāo)量加法

在矩陣的每個元素上加上給定標(biāo)量:

x = np.matrix([[1, 2], [4, 3]])

x + 1

返回:

matrix([[2, 3],

[5, 4]])

矩陣-標(biāo)量乘法

類似地,矩陣-標(biāo)量乘法就是在矩陣的每個元素上乘以給定標(biāo)量:

x * 3

返回:

matrix([[ 3, 6],

[12, 9]])

矩陣-矩陣加法

形狀相同的矩陣才能相加。兩個矩陣對應(yīng)位置的元素之和作為新矩陣的元素,而新矩陣的形狀和原本兩個矩陣一樣。

x = np.matrix([[1, 2], [4, 3]])

y = np.matrix([[3, 4], [3, 10]])

x和y的形狀均為(2, 2)。

x + y

返回:

matrix([[ 4, 6],

[ 7, 13]])

矩陣-矩陣乘法

形狀為m x n的矩陣與形狀為n x p的矩陣相乘,得到形狀為m x p的矩陣。

圖片來源:hadrienj.github.io

從編程的角度,矩陣乘法的一個直觀解釋是,一個矩陣是數(shù)據(jù),另一個矩陣是即將應(yīng)用于數(shù)據(jù)的函數(shù)(操作):

圖片來源:betterexplained.com

x = np.matrix([[1, 2], [3, 4], [5, 6]])

y = np.matrix([[7], [13]]

x * y

返回:

matrix([[ 33],

[ 73],

[113]])

上面的代碼中,矩陣x的形狀為(3, 2),矩陣y的形狀為(2, 1),故所得矩陣的形狀為(3, 1)。如果x的列數(shù)不等于y的行數(shù),則x和y不能相乘,強行相乘會報錯shapes not aligned。

矩陣轉(zhuǎn)置

矩陣轉(zhuǎn)置交換原矩陣的行和列(行變?yōu)榱校凶優(yōu)樾校?,即?/p>

x = np.matrix([[1, 2], [3, 4], [5, 6]])

x

返回:

matrix([[1, 2],

[3, 4],

[5, 6]])

使用numpy提供的transpose()方法轉(zhuǎn)置矩陣:

x.transpose()

返回:

matrix([[1, 3, 5],

[2, 4, 6]])

張量

比標(biāo)量、向量、矩陣更通用的是張量概念。在物理科學(xué)和機器學(xué)習(xí)中,有時有必要使用超過二階的張量(還記得嗎?標(biāo)量、向量、矩陣分別可以視為0、1、2階張量。)

圖片來源:refactored.ai

在Python中定義張量和一些運算

張量當(dāng)然也可以用numpy表示(超過二階的張量不過是超過二維的數(shù)組):

import numpy as np

t = np.array([

[[1,2,3], [4,5,6], [7,8,9]],

[[11,12,13], [14,15,16], [17,18,19]],

[[21,22,23], [24,25,26], [27,28,29]],

])

t.shape

返回:

(3, 3, 3)

張量加法

s = np.array([

[[1,2,3], [4,5,6], [7,8,9]],

[[10, 11, 12], [13, 14, 15], [16, 17, 18]],

[[19, 20, 21], [22, 23, 24], [25, 26, 27]],

])

s + t

返回:

array([[[ 2, 4, 6],

[ 8, 10, 12],

[14, 16, 18]],

[[21, 23, 25],

[27, 29, 31],

[33, 35, 37]],

[[40, 42, 44],

[46, 48, 50],

[52, 54, 56]]])

張量乘法

s * t得到的是阿達馬乘積(Hadamard Product),也就是分素相乘(element-wise multiplication),將張量s和t中的每個元素相乘,所得乘積為結(jié)果張量對應(yīng)位置的元素。

s * t

返回:

array([[[ 1, 4, 9],

[ 16, 25, 36],

[ 49, 64, 81]],

[[110, 132, 156],

[182, 210, 240],

[272, 306, 342]],

[[399, 440, 483],

[528, 575, 624],

[675, 728, 783]]])

張量積(Tensor Product)需要使用numpy的tensordot方法計算。

圖片來源:維基百科

計算s ? t:

s = np.array([[[1, 2], [3, 4]]])

t = np.array([[[5, 6], [7, 8]]])

np.tensordot(s, t, 0)

返回:

array([[[[[[ 5, 6],

[ 7, 8]]],

[[[10, 12],

[14, 16]]]],

[[[[15, 18],

[21, 24]]],

[[[20, 24],

[28, 32]]]]]])

其中,最后一個參數(shù)0表示求張量積。當(dāng)該參數(shù)為1時,表示求張量的點積(tensor dot product),這一運算可以視為向量點積概念的推廣;當(dāng)該參數(shù)為2時,表示求張量的縮并(tensor double contraction),這一運算可以視為矩陣乘法概念的推廣。

當(dāng)然,由于張量常用于深度學(xué)習(xí),因此我們也經(jīng)常直接使用深度學(xué)習(xí)框架表達張量。比如,在PyTorch中,創(chuàng)建一個形狀為(5, 5)的張量,然后用浮點數(shù)1填充該張量:

torch.ones(5, 5)

返回:

tensor([[ 1., 1., 1., 1., 1.],

[ 1., 1., 1., 1., 1.],

[ 1., 1., 1., 1., 1.],

[ 1., 1., 1., 1., 1.],

[ 1., 1., 1., 1., 1.]])

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 線性代數(shù)
    +關(guān)注

    關(guān)注

    5

    文章

    50

    瀏覽量

    11093
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5503

    瀏覽量

    121206

原文標(biāo)題:深度學(xué)習(xí)線性代數(shù)簡明教程

文章出處:【微信號:jqr_AI,微信公眾號:論智】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    目前主流的深度學(xué)習(xí)算法模型和應(yīng)用案例

    深度學(xué)習(xí)在科學(xué)計算中獲得了廣泛的普及,其算法被廣泛用于解決復(fù)雜問題的行業(yè)。所有深度學(xué)習(xí)算法都使用
    的頭像 發(fā)表于 01-03 10:28 ?1982次閱讀
    目前主流的<b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b><b class='flag-5'>算法</b>模型和應(yīng)用案例

    深度學(xué)習(xí)與數(shù)據(jù)挖掘的關(guān)系

    理解,但是在其高冷的背后,卻有深遠的應(yīng)用場景和未來。深度學(xué)習(xí)是實現(xiàn)機器學(xué)習(xí)的一種方式或一條路徑。其動機在于建立、模擬人腦進行分析學(xué)習(xí)的神經(jīng)網(wǎng)
    發(fā)表于 07-04 16:07

    Python深度學(xué)習(xí)數(shù)學(xué)基礎(chǔ)

    算法工程師修仙之路:Python深度學(xué)習(xí)(八)
    發(fā)表于 04-02 13:03

    深度學(xué)習(xí)算法聯(lián)合綜述

    關(guān)于深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)算法的介紹,包含有對幾種神經(jīng)網(wǎng)絡(luò)模型的詳細描述
    發(fā)表于 07-10 16:49 ?4次下載

    深度學(xué)習(xí)和普通機器學(xué)習(xí)的區(qū)別

    本質(zhì)上,深度學(xué)習(xí)提供了一套技術(shù)和算法,這些技術(shù)和算法可以幫助我們對深層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)進行參數(shù)化——人工神經(jīng)網(wǎng)絡(luò)中有很多隱含層數(shù)和參數(shù)。深度
    的頭像 發(fā)表于 06-08 14:44 ?4457次閱讀
    <b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>和普通機器<b class='flag-5'>學(xué)習(xí)</b>的區(qū)別

    深度學(xué)習(xí)算法和應(yīng)用涌現(xiàn)的背后,是各種各樣的深度學(xué)習(xí)工具和框架

    回顧深度學(xué)習(xí)框架的演變,我們可以清楚地看到深度學(xué)習(xí)框架和深度學(xué)習(xí)
    的頭像 發(fā)表于 01-21 13:46 ?2762次閱讀

    基于深度學(xué)習(xí)的行為識別算法及其應(yīng)用

    基于深度學(xué)習(xí)的行為識別算法及其應(yīng)用
    發(fā)表于 06-16 14:56 ?20次下載

    機器學(xué)習(xí)深度學(xué)習(xí)算法流程

    但是無可否認的是深度學(xué)習(xí)實在太好用啦!極大地簡化了傳統(tǒng)機器學(xué)習(xí)的整體算法分析和學(xué)習(xí)流程,更重要的是在一些通用的領(lǐng)域任務(wù)刷新了傳統(tǒng)機器
    的頭像 發(fā)表于 04-26 15:07 ?4738次閱讀

    深度學(xué)習(xí)算法簡介 深度學(xué)習(xí)算法是什么 深度學(xué)習(xí)算法有哪些

    深度學(xué)習(xí)算法簡介 深度學(xué)習(xí)算法是什么?深度
    的頭像 發(fā)表于 08-17 16:02 ?8924次閱讀

    深度學(xué)習(xí)算法工程師是做什么

    醫(yī)療、金融、自然語言處理、智能交通等等。 作為深度學(xué)習(xí)算法工程師,他們需要具備一定的技能和知識,包括數(shù)學(xué)基礎(chǔ)(如線性代數(shù)、微積分、概率論等)、編程語言(如Python、C++、Matl
    的頭像 發(fā)表于 08-17 16:03 ?1265次閱讀

    什么是深度學(xué)習(xí)算法?深度學(xué)習(xí)算法的應(yīng)用

    什么是深度學(xué)習(xí)算法?深度學(xué)習(xí)算法的應(yīng)用 深度
    的頭像 發(fā)表于 08-17 16:03 ?2168次閱讀

    深度學(xué)習(xí)算法的選擇建議

    深度學(xué)習(xí)算法的選擇建議 隨著深度學(xué)習(xí)技術(shù)的普及,越來越多的開發(fā)者將它應(yīng)用于各種領(lǐng)域,包括圖像識別、自然語言處理、聲音識別等等。對于剛開始
    的頭像 發(fā)表于 08-17 16:11 ?682次閱讀

    深度學(xué)習(xí)算法庫框架學(xué)習(xí)

    深度學(xué)習(xí)算法庫框架學(xué)習(xí) 深度學(xué)習(xí)是一種非常強大的機器學(xué)習(xí)
    的頭像 發(fā)表于 08-17 16:11 ?704次閱讀

    深度學(xué)習(xí)算法mlp介紹

    深度學(xué)習(xí)算法mlp介紹? 深度學(xué)習(xí)算法是人工智能領(lǐng)域的熱門話題。在這個領(lǐng)域中,多層感知機(mul
    的頭像 發(fā)表于 08-17 16:11 ?4394次閱讀

    深度學(xué)習(xí)框架和深度學(xué)習(xí)算法教程

    深度學(xué)習(xí)框架和深度學(xué)習(xí)算法教程 深度學(xué)習(xí)是機器
    的頭像 發(fā)表于 08-17 16:11 ?1090次閱讀