日韩一区二区乌克兰美女,久久国产欧美一区二区免费看,色综合A怡红院怡红院

編者按：2個(gè)月前，DeepMind發(fā)表了一篇名為“神經(jīng)算術(shù)邏輯單元（NALU）”的新論文，提出了一個(gè)能幫助神經(jīng)網(wǎng)絡(luò)更好地模擬數(shù)值信息的新框架。這是一篇有趣的論文，解決的問題也很實(shí)際，所以今天論智想推薦一篇有關(guān)這個(gè)框架的文章，它也是被TensorFlow官博力薦的佳作。比起復(fù)雜的論文解讀，它更簡(jiǎn)潔直觀，也易于理解。

現(xiàn)如今，盡管深度學(xué)習(xí)已經(jīng)在許多任務(wù)中取得了令人驚艷的成果，諸多AI 產(chǎn)品也逐漸在醫(yī)療等領(lǐng)域發(fā)揮越來(lái)越重要的作用，但如何教導(dǎo)神經(jīng)網(wǎng)絡(luò)還是它的一個(gè)重要問題，說出來(lái)可能有人不信，神經(jīng)網(wǎng)絡(luò)在簡(jiǎn)單算術(shù)任務(wù)上還會(huì)出現(xiàn)問題。

在一個(gè)實(shí)驗(yàn)中，DeepMind的研究人員曾訓(xùn)練了一個(gè)精度接近完美的模型，它能從數(shù)據(jù)中找出范圍在-5到5之間的數(shù)字，但當(dāng)輸入從未見過的新數(shù)據(jù)后，模型就無(wú)法概括了。

論文針對(duì)上述問題提出了兩種方法，但這里我們不會(huì)搬運(yùn)原文的詳細(xì)內(nèi)容，相反地，下文將簡(jiǎn)要介紹NAC的工作原理，以及它如何處理加減乘除等操作，相應(yīng)代碼也會(huì)在文章中列出，讀者可以從中獲得更直觀的了解。

第一個(gè)神經(jīng)網(wǎng)絡(luò)（NAC）

論文介紹的第一個(gè)神經(jīng)網(wǎng)絡(luò)是神經(jīng)累積器（簡(jiǎn)稱NAC），它能對(duì)輸入執(zhí)行線性變換，而用于變換的矩陣是tanh(What)和sigmoid(Mhat)的元素乘積。簡(jiǎn)而言之，input(x)后，模型輸入會(huì)乘以變換矩陣W，并產(chǎn)生輸出a。

NAC的Python實(shí)現(xiàn)：

import tensorflow as tf

# NAC

W_hat = tf.Variable(tf.truncated_normal(shape, stddev=0.02))

M_hat = tf.Variable(tf.truncated_normal(shape, stddev=0.02))

W = tf.tanh(W_hat) * tf.sigmoid(M_hat)

# 前向傳播

a = tf.matmul(in_dim, W)

第二個(gè)神經(jīng)網(wǎng)絡(luò)（NALU）

神經(jīng)算術(shù)邏輯單元（NALU）由兩個(gè)NAC構(gòu)成，其中，第一個(gè)NAC g是sigmoid(Gx)，第二個(gè)NAC在一個(gè)等于exp(W(log(|x| + epsilon)))的對(duì)數(shù)空間m中運(yùn)行。

NALU的Python實(shí)現(xiàn)：

import tensorflow as tf

# NALU

G = tf.Variable(tf.truncated_normal(shape, stddev=0.02))

m = tf.exp(tf.matmul(tf.log(tf.abs(in_dim)+ epsilon), W))

g = tf.sigmoid(tf.matmul(in_dim, G))

y = g * a +(1- g)* m

通過加法理解NAC

現(xiàn)在我們來(lái)進(jìn)行測(cè)試。首先，把NAC轉(zhuǎn)成函數(shù)：

# NAC

def NAC(in_dim, out_dim):

in_features = in_dim.shape[1]

# 定義W_hat和M_hat

W_hat = tf.get_variable(name = 'W_hat', initializer=tf.initializers.random_uniform(minval=-2, maxval=2),shape=[in_features, out_dim], trainable=True)

M_hat = tf.get_variable(name = 'M_hat', initializer=tf.initializers.random_uniform(minval=-2, maxval=2), shape=[in_features, out_dim], trainable=True)

W = tf.nn.tanh(W_hat) * tf.nn.sigmoid(M_hat)

a = tf.matmul(in_dim, W)

return a, W

其次，創(chuàng)建一些數(shù)據(jù)，把它們分成訓(xùn)練集和測(cè)試集。NumPy有一個(gè)較numpy.arrange的API，很適合用來(lái)創(chuàng)建數(shù)據(jù)集：

# 生成一系列輸入數(shù)字X1和X2用于訓(xùn)練

x1 = np.arange(0,10000,5, dtype=np.float32)

x2 = np.arange(5,10005,5, dtype=np.float32)

y_train = x1 + x2

x_train = np.column_stack((x1,x2))

print(x_train.shape)

print(y_train.shape)

# 生成一系列輸入數(shù)字X1和X2進(jìn)行測(cè)試

x1 = np.arange(1000,2000,8, dtype=np.float32)

x2 = np.arange(1000,1500,4, dtype= np.float32)

x_test = np.column_stack((x1,x2))

y_test = x1 + x2

print()

print(x_test.shape)

print(y_test.shape)

接著，用這些準(zhǔn)備好的東西訓(xùn)練模型。我們先定義占位符X和Y以在運(yùn)行時(shí)提供數(shù)據(jù)，用tf.reduce_sum()計(jì)算損失，模型包含兩個(gè)超參數(shù)：學(xué)習(xí)率alpha和訓(xùn)練幾個(gè)epochs。在訓(xùn)練開始前，我們還要定義一個(gè)優(yōu)化器，方便用tf.train.AdamOptimizer()降低損失。

# 定義占位符以在運(yùn)行時(shí)提供輸入

X = tf.placeholder(dtype=tf.float32, shape =[None , 2]) # Number of samples x Number of features (number of inputs to be added)

Y = tf.placeholder(dtype=tf.float32, shape=[None,])

＃定義網(wǎng)絡(luò)

＃這里網(wǎng)絡(luò)只包含一個(gè)NAC（用于測(cè)試）

y_pred, W = NAC(in_dim=X, out_dim=1)

y_pred = tf.squeeze(y_pred) # Remove extra dimensions if any

# 均方誤差 (MSE)

loss = tf.reduce_mean( (y_pred - Y) **2)

# 訓(xùn)練參數(shù)

alpha = 0.05 # learning rate

epochs = 22000

optimize = tf.train.AdamOptimizer(learning_rate=alpha).minimize(loss)

with tf.Session() as sess:

#init = tf.global_variables_initializer()

cost_history = []

sess.run(tf.global_variables_initializer())

# 訓(xùn)練前損失

print("Pre training MSE: ", sess.run (loss, feed_dict={X: x_test, Y:y_test}))

print()

for i in range(epochs):

_, cost = sess.run([optimize, loss ], feed_dict={X:x_train, Y: y_train})

print("epoch: {}, MSE: {}".format( i,cost) )

cost_history.append(cost)

# 列出每次迭代的均方誤差

plt.plot(np.arange(epochs),np.log(cost_history)) # Plot MSE on log scale

plt.xlabel("Epoch")

plt.ylabel("MSE")

plt.show()

print()

print(W.eval())

print()

# 訓(xùn)練后損失

print("Post training MSE: ", sess.run(loss, feed_dict={X: x_test, Y: y_test}))

print("Actual sum: ", y_test[0:10])

print()

print("Predicted sum: ", sess.run(y_pred[0:10], feed_dict={X: x_test, Y: y_test}))

訓(xùn)練完成后，我們可以得到這樣一幅圖損失曲線圖：

Actual sum: [2000.2012.2024.2036.2048.2060.2072.2084.2096.2108.]

Predicted sum: [1999.90212011.90152023.90092035.90042047.89972059.89922071.8984

2083.8982095.89752107.8967]

如輸出所示，NAC可以處理諸如加減法的操作，但它還做不到處理乘法和除法。為了解決這個(gè)問題，我們就要用到NALU。

通過乘法理解NALU

在上文基礎(chǔ)上，首先我們?cè)偬砑右粋€(gè)NAC，組成NALU：

如果說NAC只是對(duì)輸入做線性變化，那么NALU就是把兩個(gè)具有權(quán)重的NAC組合在一起，用來(lái)執(zhí)行加減（較小的紫色單元）和乘除（較大的紫色單元），計(jì)算由門（橙色單元）控制。

# NALU

def NALU(in_dim, out_dim):

shape = (int(in_dim.shape[-1]), out_dim)

epsilon = 1e-7

# NAC

W_hat = tf.Variable(tf.truncated_normal(shape, stddev=0.02))

M_hat = tf.Variable(tf.truncated_normal(shape, stddev=0.02))

G = tf.Variable(tf.truncated_normal(shape, stddev=0.02))

W = tf.tanh(W_hat) * tf.sigmoid(M_hat)

# 前向傳播

a = tf.matmul(in_dim, W)

# NALU

m = tf.exp(tf.matmul(tf.log(tf.abs(in_dim) + epsilon), W))

g = tf.sigmoid(tf.matmul(in_dim, G))

y = g * a + (1 - g) * m

return y

這里我們?cè)賱?chuàng)建一些數(shù)據(jù)，但和上次相比，這次要做一些改動(dòng)：在第8行和第20行，我們把運(yùn)算符從加改成了乘。

# 通過學(xué)習(xí)乘法來(lái)測(cè)試網(wǎng)絡(luò)

# 生成一系列輸入數(shù)字X1和X2用于訓(xùn)練

x1 = np.arange(0,10000,5, dtype=np.float32)

x2 = np.arange(5,10005,5, dtype=np.float32)

y_train = x1 * x2

x_train = np.column_stack((x1,x2))

print(x_train.shape)

print(y_train.shape)

# 生成一系列輸入數(shù)字X1和X2進(jìn)行測(cè)試

x1 = np.arange(1000,2000,8, dtype=np.float32)

x2 = np.arange(1000,1500,4, dtype= np.float32)

x_test = np.column_stack((x1,x2))

y_test = x1 * x2

print()

print(x_test.shape)

print(y_test.shape)

之后是訓(xùn)練模型，需要注意的是，這里我們定義的還是NAC，而不是NALU：

# 定義占位符以在運(yùn)行時(shí)提供值

X = tf.placeholder(dtype=tf.float32, shape =[None , 2]) # Number of samples x Number of features (number of inputs to be added)

Y = tf.placeholder(dtype=tf.float32, shape=[None,])

# 定義網(wǎng)絡(luò)

# 這里網(wǎng)絡(luò)只包含一個(gè)NAC（用于測(cè)試）

y_pred = NALU(in_dim=X, out_dim=1)

y_pred = tf.squeeze(y_pred) # Remove extra dimensions if any

# 均方誤差 (MSE)

loss = tf.reduce_mean( (y_pred - Y) **2)

# 訓(xùn)練參數(shù)

alpha = 0.05 # 學(xué)習(xí)率

epochs = 22000

optimize = tf.train.AdamOptimizer(learning_rate=alpha).minimize(loss)

with tf.Session() as sess:

#init = tf.global_variables_initializer()

cost_history = []

sess.run(tf.global_variables_initializer())

# 訓(xùn)練前損失

print("Pre training MSE: ", sess.run (loss, feed_dict={X: x_test, Y: y_test}))

print()

for i in range(epochs):

_, cost = sess.run([optimize, loss ], feed_dict={X: x_train, Y: y_train})

print("epoch: {}, MSE: {}".format( i,cost) )

cost_history.append(cost)

# 列出每次迭代的損失

plt.plot(np.arange(epochs),np.log(cost_history)) # Plot MSE on log scale

plt.xlabel("Epoch")

plt.ylabel("MSE")

plt.show()

# 訓(xùn)練后損失

print("Post training MSE: ", sess.run(loss, feed_dict={X: x_test, Y: y_test}))

print("Actual product: ", y_test[0:10])

print()

print("Predicted product: ", sess.run(y_pred[0:10], feed_dict={X: x_test, Y: y_test}))

Actual product: [1000000.1012032.1024128.1036288.1048512.1060800.1073152.1085568.

1098048.1110592.]

Predicted product: [1000000.21012032. 1024127.561036288.61048512.061060800.8

1073151.61085567.61098047.61110592.8 ]

如果想獲取在TensorFlow中實(shí)現(xiàn)NALU的完整代碼，可以去這個(gè)github：github.com/ahylton19/simpleNALU-tf

小結(jié)

以上只是NALU在加減乘除任務(wù)上具體表現(xiàn)，在論文中，研究人員還測(cè)試了平方運(yùn)算和開根，NALU的表現(xiàn)都優(yōu)于傳統(tǒng)框架。簡(jiǎn)而言之，DeepMind的這個(gè)簡(jiǎn)單而實(shí)用的技術(shù)讓神經(jīng)網(wǎng)絡(luò)掌握了數(shù)值推算，它類似傳統(tǒng)處理器中的算術(shù)邏輯單元，能讓網(wǎng)絡(luò)真正“學(xué)會(huì)”加減乘除和基于加減乘除的近似估計(jì)，更好地把經(jīng)驗(yàn)外推到其他數(shù)值任務(wù)上，而不再受訓(xùn)練數(shù)據(jù)限制。

通過這篇文章，我們希望現(xiàn)在你已經(jīng)了解了這篇轟動(dòng)學(xué)界的論文到底說了什么，以及它對(duì)深度學(xué)習(xí)的貢獻(xiàn)和影響。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

神經(jīng)網(wǎng)絡(luò)

神經(jīng)網(wǎng)絡(luò)

+關(guān)注

關(guān)注
42

文章
4773

瀏覽量
100861
數(shù)據(jù)

數(shù)據(jù)

+關(guān)注

關(guān)注
8

文章
7073

瀏覽量
89137
NAC

NAC

+關(guān)注

關(guān)注
0

文章
5

瀏覽量
7714

原文標(biāo)題：TensorFlow推薦：神經(jīng)算術(shù)邏輯單元的直觀理解

文章出處：【微信號(hào)：jqr_AI，微信公眾號(hào)：論智】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

評(píng)論

相關(guān)推薦

matlab 神經(jīng)網(wǎng)絡(luò) 數(shù)學(xué)建模數(shù)值分析

matlab神經(jīng)網(wǎng)絡(luò) 數(shù)學(xué)建模數(shù)值分析精通的可以討論下

發(fā)表于 09-18 15:14

求助大神關(guān)于神經(jīng)網(wǎng)絡(luò)的問題

求助大神小的現(xiàn)在有個(gè)難題：一組車重實(shí)時(shí)數(shù)據(jù) 對(duì)應(yīng)一個(gè)車重的最終數(shù)值（一

發(fā)表于 07-14 13:35

【PYNQ-Z2試用體驗(yàn)】神經(jīng)網(wǎng)絡(luò)基礎(chǔ)知識(shí)

思考問題的過程。人腦輸入一個(gè)問題，進(jìn)行思考，然后給出答案。神經(jīng)網(wǎng)絡(luò)就是在模擬人的思考這一過程。而我們要做的就是以數(shù)學(xué)的方式，將這

發(fā)表于 03-03 22:10

容差模擬電路軟故障診斷的小波與量子神經(jīng)網(wǎng)絡(luò)方法設(shè)計(jì)

的成分做為電路故障特征，再輸入給量子神經(jīng)網(wǎng)絡(luò)。不僅解決了一個(gè)可測(cè)試點(diǎn)問題，并提高了辨識(shí)故障類別的能力，而且在網(wǎng)絡(luò)訓(xùn)練之前，利用主元分析降低了網(wǎng)絡(luò)

發(fā)表于 07-05 08:06

【案例分享】ART神經(jīng)網(wǎng)絡(luò)與SOM神經(jīng)網(wǎng)絡(luò)

今天學(xué)習(xí)了兩個(gè)神經(jīng)網(wǎng)絡(luò)，分別是自適應(yīng)諧振（ART）神經(jīng)網(wǎng)絡(luò)與自組織映射（SOM）神經(jīng)網(wǎng)絡(luò)。整體感覺不是很難，只不過一些最基礎(chǔ)的概念容易理解不

發(fā)表于 07-21 04:30

人工神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)方法有哪些？

人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network，ANN)是一種類似生物神經(jīng)網(wǎng)絡(luò)的信息處理結(jié)構(gòu)，它的提出是為了解決一些非線性

發(fā)表于 08-01 08:06

如何設(shè)計(jì)BP神經(jīng)網(wǎng)絡(luò)圖像壓縮算法？

神經(jīng)網(wǎng)絡(luò)(Neural Networks)是人工神經(jīng)網(wǎng)絡(luò)(Ar-tificial Neural Networks)的簡(jiǎn)稱，是當(dāng)前的研究熱點(diǎn)之一。人腦在接受視覺感官傳來(lái)的大量圖像信息后，

發(fā)表于 08-08 06:11

卷積神經(jīng)網(wǎng)絡(luò)的層級(jí)結(jié)構(gòu)和常用框架

　　卷積神經(jīng)網(wǎng)絡(luò)的層級(jí)結(jié)構(gòu)　　卷積神經(jīng)網(wǎng)絡(luò)的常用框架

發(fā)表于 12-29 06:16

如何構(gòu)建神經(jīng)網(wǎng)絡(luò)？

原文鏈接：http://tecdat.cn/?p=5725 神經(jīng)網(wǎng)絡(luò)是一種基于現(xiàn)有數(shù)據(jù)創(chuàng)建預(yù)測(cè)的計(jì)算系統(tǒng)。如何構(gòu)建神經(jīng)網(wǎng)絡(luò)？神經(jīng)網(wǎng)絡(luò)包括：輸入層：根據(jù)現(xiàn)有數(shù)據(jù)獲取輸入的層隱藏層：使用反

發(fā)表于 07-12 08:02

如何使用Keras框架搭建一個(gè)小型的神經(jīng)網(wǎng)絡(luò)多層感知器

本文介紹了如何使用Keras框架，搭建一個(gè)小型的神經(jīng)網(wǎng)絡(luò)-多層感知器，并通過給定數(shù)據(jù)進(jìn)行計(jì)算訓(xùn)練，最好將訓(xùn)練得到的模型提取出參數(shù)，放在51單片機(jī)上進(jìn)行運(yùn)行。

發(fā)表于 11-22 07:00

如何利用卷積神經(jīng)網(wǎng)絡(luò)去更好地控制巡線智能車呢

巡線智能車控制中的CNN網(wǎng)絡(luò)有何應(yīng)用？嵌入式單片機(jī)中的神經(jīng)網(wǎng)絡(luò)該怎樣去使用？如何利用卷積神經(jīng)網(wǎng)絡(luò)去更好地控制巡線智能車呢？

發(fā)表于 12-21 07:47

圖像預(yù)處理和改進(jìn)神經(jīng)網(wǎng)絡(luò)推理的簡(jiǎn)要介紹

為提升識(shí)別準(zhǔn)確率，采用改進(jìn)神經(jīng)網(wǎng)絡(luò)，通過Mnist數(shù)據(jù)集進(jìn)行訓(xùn)練。整體處理過程分為兩步：圖像預(yù)處理和改進(jìn)神經(jīng)網(wǎng)絡(luò)推理。圖像預(yù)處理主要根據(jù)圖像的特征，將數(shù)據(jù)處理成規(guī)范的格式，而改進(jìn)神經(jīng)網(wǎng)絡(luò)推理主要用于輸出結(jié)果。整個(gè)過程分為兩

發(fā)表于 12-23 08:07

神經(jīng)網(wǎng)絡(luò)基本介紹

神經(jīng)網(wǎng)絡(luò)基本介紹，人工神經(jīng)網(wǎng)絡(luò)（簡(jiǎn)稱神經(jīng)網(wǎng)絡(luò)，Neural Network）是模擬人腦思維方式的數(shù)學(xué)模型。 神經(jīng)網(wǎng)絡(luò)是在現(xiàn)代生物

發(fā)表于 12-06 15:07 ?0次下載

12個(gè)將神經(jīng)網(wǎng)絡(luò)畫地更好看的工具

本文介紹了了12個(gè)將神經(jīng)網(wǎng)絡(luò)畫地更好看的工具。一個(gè)用于畫卷積神經(jīng)網(wǎng)絡(luò)的Python腳本

發(fā)表于 06-13 14:10 ?3761次閱讀

卷積神經(jīng)網(wǎng)絡(luò)和bp神經(jīng)網(wǎng)絡(luò)的區(qū)別

不同的神經(jīng)網(wǎng)絡(luò)模型，它們?cè)诮Y(jié)構(gòu)、原理、應(yīng)用等方面都存在一定的差異。本文將從多個(gè)方面對(duì)這兩種神經(jīng)網(wǎng)絡(luò)進(jìn)行詳細(xì)的比較和分析。引言 神經(jīng)網(wǎng)絡(luò)是一

發(fā)表于 07-02 14:24 ?4262次閱讀

搜索歷史

一個(gè)能幫助神經(jīng)網(wǎng)絡(luò)更好地模擬數(shù)值信息的新框架

評(píng)論

matlab 神經(jīng)網(wǎng)絡(luò) 數(shù)學(xué)建模數(shù)值分析

求助大神關(guān)于神經(jīng)網(wǎng)絡(luò)的問題

【PYNQ-Z2試用體驗(yàn)】神經(jīng)網(wǎng)絡(luò)基礎(chǔ)知識(shí)

容差模擬電路軟故障診斷的小波與量子神經(jīng)網(wǎng)絡(luò)方法設(shè)計(jì)

【案例分享】ART神經(jīng)網(wǎng)絡(luò)與SOM神經(jīng)網(wǎng)絡(luò)

人工神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)方法有哪些？

如何設(shè)計(jì)BP神經(jīng)網(wǎng)絡(luò)圖像壓縮算法？

卷積神經(jīng)網(wǎng)絡(luò)的層級(jí)結(jié)構(gòu)和常用框架

如何構(gòu)建神經(jīng)網(wǎng)絡(luò)？

如何使用Keras框架搭建一個(gè)小型的神經(jīng)網(wǎng)絡(luò)多層感知器

如何利用卷積神經(jīng)網(wǎng)絡(luò)去更好地控制巡線智能車呢

圖像預(yù)處理和改進(jìn)神經(jīng)網(wǎng)絡(luò)推理的簡(jiǎn)要介紹

神經(jīng)網(wǎng)絡(luò)基本介紹

12個(gè)將神經(jīng)網(wǎng)絡(luò)畫地更好看的工具

卷積神經(jīng)網(wǎng)絡(luò)和bp神經(jīng)網(wǎng)絡(luò)的區(qū)別