我的十四岁2009意大利,性久久久久

神經(jīng)網(wǎng)絡(luò)是深度學(xué)習(xí)的載體，而神經(jīng)網(wǎng)絡(luò)模型中，最經(jīng)典非RNN模型所屬，盡管它不完美，但它具有學(xué)習(xí)歷史信息的能力。后面不管是encode-decode 框架，還是注意力模型，以及自注意力模型，以及更加強(qiáng)大的Bert模型家族，都是站在RNN的肩上，不斷演化、變強(qiáng)的。

這篇文章，闡述了RNN的方方面面，包括模型結(jié)構(gòu)，優(yōu)缺點(diǎn)，RNN模型的幾種應(yīng)用，RNN常使用的激活函數(shù)，RNN的缺陷，以及GRU，LSTM是如何試圖解決這些問題，RNN變體等。

這篇文章最大特點(diǎn)是圖解版本，其次語言簡練，總結(jié)全面。

概述

傳統(tǒng)RNN的體系結(jié)構(gòu)。Recurrent neural networks，也稱為RNNs，是一類允許先前的輸出用作輸入，同時具有隱藏狀態(tài)的神經(jīng)網(wǎng)絡(luò)。它們通常如下所示：

對于每一時步 , 激活函數(shù) ，輸出被表達(dá)為:

這里是時間維度網(wǎng)絡(luò)的共享權(quán)重系數(shù)

是激活函數(shù)

下表總結(jié)了典型RNN架構(gòu)的優(yōu)缺點(diǎn)：

優(yōu)點(diǎn)	缺點(diǎn)
處理任意長度的輸入	計算速度慢
模型形狀不隨輸入長度增加	難以獲取很久以前的信息
計算考慮了歷史信息	無法考慮當(dāng)前狀態(tài)的任何未來輸入
權(quán)重隨時間共享

RNNs應(yīng)用

RNN模型主要應(yīng)用于自然語言處理和語音識別領(lǐng)域。下表總結(jié)了不同的應(yīng)用：

一對一

傳統(tǒng)神經(jīng)網(wǎng)絡(luò)

一對多

音樂生成

多對一

機(jī)器翻譯

RNN 類型圖解例子

對于RNN網(wǎng)絡(luò)，所有時間步的損失函數(shù) 是根據(jù)每個時間步的損失定義的，如下所示：損失函數(shù)

時間反向傳播

在每個時間點(diǎn)進(jìn)行反向傳播。在時間步，損失相對于權(quán)重矩陣的偏導(dǎo)數(shù)表示如下：

處理長短依賴

常用激活函數(shù)

RNN模塊中最常用的激活函數(shù)描述如下：

SigmoidTanhRELU

梯度消失/爆炸

在RNN中經(jīng)常遇到梯度消失和爆炸現(xiàn)象。之所以會發(fā)生這種情況，是因?yàn)楹茈y捕捉到長期的依賴關(guān)系，因?yàn)槌朔ㄌ荻瓤梢噪S著層的數(shù)量呈指數(shù)遞減/遞增。

梯度修剪

梯度修剪是一種技術(shù)，用于執(zhí)行反向傳播時，有時遇到的梯度爆炸問題。通過限制梯度的最大值，這種現(xiàn)象在實(shí)踐中得以控制。

門的類型

為了解決消失梯度問題，在某些類型的RNN中使用特定的門，并且通常有明確的目的。它們通常標(biāo)注為，等于：

其中，是特定于門的系數(shù)，是sigmoid函數(shù)。主要內(nèi)容總結(jié)如下表：

Gated Recurrent Unit（GRU）和長-短期記憶單元（LSTM）處理傳統(tǒng)RNNs遇到的消失梯度問題，LSTM是GRU的推廣。下表總結(jié)了每種結(jié)構(gòu)的特征方程：GRU/LSTM

注：符號表示兩個向量之間按元素相乘。

RNN的變體

下表總結(jié)了其他常用的RNN模型：

Bidirectional （BRNN）Deep （DRNN）

編輯：jq

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

函數(shù)

函數(shù)

+關(guān)注

關(guān)注
3

文章
4331

瀏覽量
62622
rnn

rnn

+關(guān)注

關(guān)注
0

文章
89

瀏覽量
6891

原文標(biāo)題：神經(jīng)網(wǎng)絡(luò)RNN圖解！

文章出處：【微信號：tyutcsplab，微信公眾號：智能感知與物聯(lián)網(wǎng)技術(shù)研究所】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

RNN的損失函數(shù)與優(yōu)化算法解析

函數(shù)有以下幾種：交叉熵?fù)p失函數(shù) ：交叉熵（Cross Entropy）是一種評估兩個概率分布之間差異的度量方法，即通過比較模型預(yù)測的概率分布和真實(shí)概率分布之間的差異，來評估模型訓(xùn)練的性能。在

發(fā)表于 11-15 10:16 ?406次閱讀

RNN在實(shí)時數(shù)據(jù)分析中的應(yīng)用

隨著大數(shù)據(jù)時代的到來，實(shí)時數(shù)據(jù)分析變得越來越重要。在眾多的機(jī)器學(xué)習(xí)模型中，遞歸神經(jīng)網(wǎng)絡(luò)（Recurrent Neural Networks，簡稱RNN）因其在處理序列數(shù)據(jù)方面的優(yōu)勢，被廣泛應(yīng)用于實(shí)時數(shù)據(jù)

發(fā)表于 11-15 10:11 ?294次閱讀

RNN的應(yīng)用領(lǐng)域及未來發(fā)展趨勢

循環(huán)神經(jīng)網(wǎng)絡(luò)（Recurrent Neural Network, RNN）是一種適合于處理序列數(shù)據(jù)的深度學(xué)習(xí)模型。由于其獨(dú)特的循環(huán)結(jié)構(gòu)，RNN

發(fā)表于 11-15 10:10 ?445次閱讀

RNN與LSTM模型的比較分析

RNN（循環(huán)神經(jīng)網(wǎng)絡(luò)）與LSTM（長短期記憶網(wǎng)絡(luò)）模型在深度學(xué)習(xí)領(lǐng)域都具有處理序列數(shù)據(jù)的能力，但它們在結(jié)構(gòu)、功能和應(yīng)用上存在顯著的差異。以下是對RN

發(fā)表于 11-15 10:05 ?439次閱讀

深度學(xué)習(xí)中RNN的優(yōu)勢與挑戰(zhàn)

循環(huán)神經(jīng)網(wǎng)絡(luò)（RNN）是深度學(xué)習(xí)領(lǐng)域中處理序列數(shù)據(jù)的基石。它們通過在每個時間步長上循環(huán)傳遞信息，使得網(wǎng)絡(luò)能夠捕捉時間序列數(shù)據(jù)中的長期依賴關(guān)系。然而，盡管RNN在某些任務(wù)上表現(xiàn)出色，它們也面臨著一些

發(fā)表于 11-15 09:55 ?405次閱讀

LSTM神經(jīng)網(wǎng)絡(luò)與傳統(tǒng)RNN的區(qū)別

在深度學(xué)習(xí)領(lǐng)域，循環(huán)神經(jīng)網(wǎng)絡(luò)（RNN）因其能夠處理序列數(shù)據(jù)而受到廣泛關(guān)注。然而，傳統(tǒng)RNN在處理長序列時存在梯度消失或梯度爆炸的問題。為了解決這一問題，LSTM（長短期記憶）神經(jīng)網(wǎng)絡(luò)應(yīng)運(yùn)而生。循環(huán)

發(fā)表于 11-13 09:58 ?315次閱讀

AI大模型與小模型的優(yōu)缺點(diǎn)

在人工智能（AI）的廣闊領(lǐng)域中，模型作為算法與數(shù)據(jù)之間的橋梁，扮演著至關(guān)重要的角色。根據(jù)模型的大小和復(fù)雜度，我們可以將其大致分為AI大模型和小模型。這兩種

發(fā)表于 07-10 10:39 ?2749次閱讀

CNN與RNN的關(guān)系?

在深度學(xué)習(xí)的廣闊領(lǐng)域中，卷積神經(jīng)網(wǎng)絡(luò)（CNN）和循環(huán)神經(jīng)網(wǎng)絡(luò)（RNN）是兩種極為重要且各具特色的神經(jīng)網(wǎng)絡(luò)模型。它們各自在圖像處理、自然語言處理等領(lǐng)域展現(xiàn)出卓越的性能。本文將從概念、原理、應(yīng)用場景及代碼示例等方面詳細(xì)探討CNN與

發(fā)表于 07-08 16:56 ?759次閱讀

rnn是什么神經(jīng)網(wǎng)絡(luò)模型

RNN（Recurrent Neural Network，循環(huán)神經(jīng)網(wǎng)絡(luò)）是一種具有循環(huán)結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò)模型，它能夠處理序列數(shù)據(jù)，并對序列中的元素進(jìn)行建模。RNN在自然語言處理、語音識別、

發(fā)表于 07-05 09:50 ?613次閱讀

rnn是什么神經(jīng)網(wǎng)絡(luò)

時間步的輸入，從而實(shí)現(xiàn)對時間序列數(shù)據(jù)的處理。RNN的循環(huán)結(jié)構(gòu)使得網(wǎng)絡(luò)能夠在處理當(dāng)前時間步的數(shù)據(jù)時，考慮到之前

發(fā)表于 07-05 09:49 ?686次閱讀

rnn神經(jīng)網(wǎng)絡(luò)模型原理

的應(yīng)用。本文將介紹RNN的原理、結(jié)構(gòu)、優(yōu)化方法以及實(shí)際應(yīng)用。 RNN的基本原理 1.1 循環(huán)結(jié)構(gòu) RNN

發(fā)表于 07-04 15:40 ?595次閱讀

RNN神經(jīng)網(wǎng)絡(luò)適用于什么

RNN（Recurrent Neural Network，循環(huán)神經(jīng)網(wǎng)絡(luò)）是一種具有循環(huán)結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò)，它可以處理序列數(shù)據(jù)，具有記憶功能。RNN在許多領(lǐng)域都有廣泛的應(yīng)用，以下是一些RNN

發(fā)表于 07-04 15:04 ?995次閱讀

什么是RNN(循環(huán)神經(jīng)網(wǎng)絡(luò))？RNN的基本原理和優(yōu)缺點(diǎn)

的時序信息和語義信息。RNN的提出基于記憶模型的想法，期望網(wǎng)絡(luò)能夠記住前面出現(xiàn)的特征，并依據(jù)這些特征推斷后續(xù)的結(jié)果。由于其獨(dú)特的循環(huán)結(jié)構(gòu)，RNN在自然語言處理（NLP）、語音識別、時間

發(fā)表于 07-04 11:48 ?3647次閱讀

NLP模型中RNN與CNN的選擇

在NLP中的應(yīng)用場景、工作原理、優(yōu)缺點(diǎn)，以及在選擇時應(yīng)考慮的關(guān)鍵因素，以期為讀者提供一個全面而深入的理解。

發(fā)表于 07-03 15:59 ?539次閱讀

什么是RNN （循環(huán)神經(jīng)網(wǎng)絡(luò)）？

循環(huán)神經(jīng)網(wǎng)絡(luò) (RNN) 是一種深度學(xué)習(xí)結(jié)構(gòu)，它使用過去的信息來提高網(wǎng)絡(luò)處理當(dāng)前和將來輸入的性能。RNN 的獨(dú)特之處在于該網(wǎng)絡(luò)包含隱藏狀態(tài)和循環(huán)。

發(fā)表于 02-29 14:56 ?4051次閱讀

搜索歷史

深度分析RNN的模型結(jié)構(gòu)，優(yōu)缺點(diǎn)以及RNN模型的幾種應(yīng)用

評論

RNN的損失函數(shù)與優(yōu)化算法解析

RNN在實(shí)時數(shù)據(jù)分析中的應(yīng)用

RNN的應(yīng)用領(lǐng)域及未來發(fā)展趨勢

RNN與LSTM模型的比較分析

深度學(xué)習(xí)中RNN的優(yōu)勢與挑戰(zhàn)

LSTM神經(jīng)網(wǎng)絡(luò)與傳統(tǒng)RNN的區(qū)別

AI大模型與小模型的優(yōu)缺點(diǎn)

CNN與RNN的關(guān)系?

rnn是什么神經(jīng)網(wǎng)絡(luò)模型

rnn是什么神經(jīng)網(wǎng)絡(luò)

rnn神經(jīng)網(wǎng)絡(luò)模型原理

RNN神經(jīng)網(wǎng)絡(luò)適用于什么

什么是RNN(循環(huán)神經(jīng)網(wǎng)絡(luò))？RNN的基本原理和優(yōu)缺點(diǎn)

NLP模型中RNN與CNN的選擇

什么是RNN （循環(huán)神經(jīng)網(wǎng)絡(luò)）？

搜索歷史

深度分析RNN的模型結(jié)構(gòu)，優(yōu)缺點(diǎn)以及RNN模型的幾種應(yīng)用

評論

深度分析RNN的模型結(jié)構(gòu)，優(yōu)缺點(diǎn)以及RNN模型的幾種應(yīng)用