資料介紹
在傳統(tǒng)神經(jīng)網(wǎng)絡(luò)中,模型不會(huì)關(guān)注上一時(shí)刻的處理會(huì)有什么信息可以用于下一時(shí)刻,每一次都只會(huì)關(guān)注當(dāng)前時(shí)刻的處理。舉個(gè)例子來(lái)說(shuō),我們想對(duì)一部影片中每一刻出現(xiàn)的事件進(jìn)行分類,如果我們知道電影前面的事件信息,那么對(duì)當(dāng)前時(shí)刻事件的分類就會(huì)非常容易。實(shí)際上,傳統(tǒng)神經(jīng)網(wǎng)絡(luò)沒(méi)有記憶功能,所以它對(duì)每一刻出現(xiàn)的事件進(jìn)行分類時(shí)不會(huì)用到影片已經(jīng)出現(xiàn)的信息,那么有什么方法可以讓神經(jīng)網(wǎng)絡(luò)能夠記住這些信息呢?答案就是Recurrent Neural Networks(RNNs)遞歸神經(jīng)網(wǎng)絡(luò)。
遞歸神經(jīng)網(wǎng)絡(luò)的結(jié)果與傳統(tǒng)神經(jīng)網(wǎng)絡(luò)有一些不同,它帶有一個(gè)指向自身的環(huán),用來(lái)表示它可以傳遞當(dāng)前時(shí)刻處理的信息給下一時(shí)刻使用,結(jié)構(gòu)如下:

其中, Xt 為輸入,A 為模型處理部分, ht 為輸出。
為了更容易地說(shuō)明遞歸神經(jīng)網(wǎng)絡(luò),我們把上圖展開(kāi),得到:

這樣的一條鏈狀神經(jīng)網(wǎng)絡(luò)代表了一個(gè)遞歸神經(jīng)網(wǎng)絡(luò),可以認(rèn)為它是對(duì)相同神經(jīng)網(wǎng)絡(luò)的多重復(fù)制,每一時(shí)刻的神經(jīng)網(wǎng)絡(luò)會(huì)傳遞信息給下一時(shí)刻。如何理解它呢?假設(shè)有這樣一個(gè)語(yǔ)言模型,我們要根據(jù)句子中已出現(xiàn)的詞預(yù)測(cè)當(dāng)前詞是什么,遞歸神經(jīng)網(wǎng)絡(luò)的工作原理如下:

其中,W 為各類權(quán)重,x 表示輸入,y 表示輸出,h 表示隱層處理狀態(tài)。
遞歸神經(jīng)網(wǎng)絡(luò)因?yàn)榫哂幸欢ǖ挠洃浌δ埽梢员挥脕?lái)解決很多問(wèn)題,例如:語(yǔ)音識(shí)別、語(yǔ)言模型、機(jī)器翻譯等。但是它并不能很好地處理長(zhǎng)時(shí)依賴問(wèn)題。
長(zhǎng)時(shí)依賴問(wèn)題
長(zhǎng)時(shí)依賴是這樣的一個(gè)問(wèn)題,當(dāng)預(yù)測(cè)點(diǎn)與依賴的相關(guān)信息距離比較遠(yuǎn)的時(shí)候,就難以學(xué)到該相關(guān)信息。例如在句子”我出生在法國(guó),……,我會(huì)說(shuō)法語(yǔ)“中,若要預(yù)測(cè)末尾”法語(yǔ)“,我們需要用到上下文”法國(guó)“。理論上,遞歸神經(jīng)網(wǎng)絡(luò)是可以處理這樣的問(wèn)題的,但是實(shí)際上,常規(guī)的遞歸神經(jīng)網(wǎng)絡(luò)并不能很好地解決長(zhǎng)時(shí)依賴,好的是LSTMs可以很好地解決這個(gè)問(wèn)題。
LSTM 神經(jīng)網(wǎng)絡(luò)
Long Short Term Mermory network(LSTM)是一種特殊的RNNs,可以很好地解決長(zhǎng)時(shí)依賴問(wèn)題。那么它與常規(guī)神經(jīng)網(wǎng)絡(luò)有什么不同?
首先我們來(lái)看RNNs具體一點(diǎn)的結(jié)構(gòu):

所有的遞歸神經(jīng)網(wǎng)絡(luò)都是由重復(fù)神經(jīng)網(wǎng)絡(luò)模塊構(gòu)成的一條鏈,可以看到它的處理層非常簡(jiǎn)單,通常是一個(gè)單tanh層,通過(guò)當(dāng)前輸入及上一時(shí)刻的輸出來(lái)得到當(dāng)前輸出。與神經(jīng)網(wǎng)絡(luò)相比,經(jīng)過(guò)簡(jiǎn)單地改造,它已經(jīng)可以利用上一時(shí)刻學(xué)習(xí)到的信息進(jìn)行當(dāng)前時(shí)刻的學(xué)習(xí)了。
LSTM的結(jié)構(gòu)與上面相似,不同的是它的重復(fù)模塊會(huì)比較復(fù)雜一點(diǎn),它有四層結(jié)構(gòu):

其中,處理層出現(xiàn)的符號(hào)及表示意思如下:

LSTMs的核心思想
理解LSTMs的關(guān)鍵就是下面的矩形方框,被稱為memory block(記憶塊),主要包含了三個(gè)門(forget gate、input gate、output gate)與一個(gè)記憶單元(cell)。方框內(nèi)上方的那條水平線,被稱為cell state(單元狀態(tài)),它就像一個(gè)傳送帶,可以控制信息傳遞給下一時(shí)刻。

這個(gè)矩形方框還可以表示為:

這兩個(gè)圖可以對(duì)應(yīng)起來(lái)看,下圖中心的 ct 即cell,從下方輸入( ht?1 , xt )到輸出 ht的一條線即為cell state, ft,it,ot 分別為遺忘門、輸入門、輸出門,用sigmoid層表示。上圖中的兩個(gè)tanh層則分別對(duì)應(yīng)cell的輸入與輸出。
LSTM可以通過(guò)門控單元可以對(duì)cell添加和刪除信息。通過(guò)門可以有選擇地決定信息是否通過(guò),它有一個(gè)sigmoid神經(jīng)網(wǎng)絡(luò)層和一個(gè)成對(duì)乘法操作組成,如下:

該層的輸出是一個(gè)介于0到1的數(shù),表示允許信息通過(guò)的多少,0 表示完全不允許通過(guò),1表示允許完全通過(guò)。
逐步解析LSTM
LSTM第一步是用來(lái)決定什么信息可以通過(guò)cell state。這個(gè)決定由“forget gate”層通過(guò) sigmoid 來(lái)控制,它會(huì)根據(jù)上一時(shí)刻的輸出 ht?1 和當(dāng)前輸入 xt 來(lái)產(chǎn)生一個(gè)0到1 的 ft 值,來(lái)決定是否讓上一時(shí)刻學(xué)到的信息 Ct?1 通過(guò)或部分通過(guò)。如下:

舉個(gè)例子來(lái)說(shuō)就是,我們?cè)谥暗木渥又袑W(xué)到了很多東西,一些東西對(duì)當(dāng)前來(lái)講是沒(méi)用的,可以對(duì)它進(jìn)行選擇性地過(guò)濾。
第二步是產(chǎn)生我們需要更新的新信息。這一步包含兩部分,第一個(gè)是一個(gè)“input gate”層通過(guò)sigmoid來(lái)決定哪些值用來(lái)更新,第二個(gè)是一個(gè)tanh層用來(lái)生成新的候選值,它作為當(dāng)前層產(chǎn)生的候選值可能會(huì)添加到cell state中。我們會(huì)把這兩部分產(chǎn)生的值結(jié)合來(lái)進(jìn)行更新。

現(xiàn)在我們對(duì)老的cell state進(jìn)行更新,首先,我們將老的cell state乘以 ft 來(lái)忘掉我們不需要的信息,然后再與 it ? 相加,得到了候選值。
一二步結(jié)合起來(lái)就是丟掉不需要的信息,添加新信息的過(guò)程:
舉個(gè)例子就是,在前面的句子中我們保存的是張三的信息,現(xiàn)在有了新的李四信息,我們需要把張三的信息丟棄掉,然后把李四的信息保存下來(lái)。
最后一步是決定模型的輸出,首先是通過(guò)sigmoid層來(lái)得到一個(gè)初始輸出,然后使用tanh將 Ct 值縮放到-1到1間,再與sigmoid得到的輸出逐對(duì)相乘,從而得到模型的輸出。
這顯然可以理解,首先sigmoid函數(shù)的輸出是不考慮先前時(shí)刻學(xué)到的信息的輸出,tanh函數(shù)是對(duì)先前學(xué)到信息的壓縮處理,起到穩(wěn)定數(shù)值的作用,兩者的結(jié)合學(xué)習(xí)就是遞歸神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)思想。至于模型是如何學(xué)習(xí)的,那就是后向傳播誤差學(xué)習(xí)權(quán)重的一個(gè)過(guò)程了。
上面是對(duì)LSTM一個(gè)典型結(jié)構(gòu)的理解,當(dāng)然,它也會(huì)有一些結(jié)構(gòu)上的變形,但思想基本不變,這里也就不多講了。
來(lái)源:電子創(chuàng)新網(wǎng)
- 人工神經(jīng)網(wǎng)絡(luò)的原理及仿真實(shí)例 0次下載
- 神經(jīng)網(wǎng)絡(luò)基礎(chǔ)問(wèn)題的整理 11次下載
- 基于進(jìn)化計(jì)算的神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)與實(shí)現(xiàn) 4次下載
- 基于神經(jīng)網(wǎng)絡(luò)的優(yōu)化計(jì)算實(shí)驗(yàn) 43次下載
- 人工神經(jīng)網(wǎng)絡(luò)控制 13次下載
- 人工智能-BP神經(jīng)網(wǎng)絡(luò)算法的簡(jiǎn)單實(shí)現(xiàn) 12次下載
- 基于不同神經(jīng)網(wǎng)絡(luò)的文本分類方法研究對(duì)比 49次下載
- 結(jié)合小波變換的LSTM循環(huán)神經(jīng)網(wǎng)絡(luò)的稅收預(yù)測(cè) 10次下載
- 基于PCA和LSTM神經(jīng)網(wǎng)絡(luò)的硬件木馬檢測(cè)方法 18次下載
- 基于PCA和LSTM神經(jīng)網(wǎng)絡(luò)的硬件木馬檢測(cè)方法 10次下載
- 基于LSTM和CNN融合的深度神經(jīng)網(wǎng)絡(luò)個(gè)人信用評(píng)分方法 32次下載
- 長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)(LSTM)
- 神經(jīng)網(wǎng)絡(luò)的應(yīng)用及發(fā)展的詳細(xì)資料說(shuō)明 2次下載
- 神經(jīng)網(wǎng)絡(luò)與神經(jīng)網(wǎng)絡(luò)控制的學(xué)習(xí)課件免費(fèi)下載 7次下載
- BP神經(jīng)網(wǎng)絡(luò)的簡(jiǎn)單MATLAB實(shí)例免費(fèi)下載 5次下載
- LSTM神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)與工作機(jī)制 526次閱讀
- BP神經(jīng)網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)的關(guān)系 1677次閱讀
- BP神經(jīng)網(wǎng)絡(luò)和人工神經(jīng)網(wǎng)絡(luò)的區(qū)別 1224次閱讀
- 如何理解RNN與LSTM神經(jīng)網(wǎng)絡(luò) 679次閱讀
- 全連接前饋神經(jīng)網(wǎng)絡(luò)與前饋神經(jīng)網(wǎng)絡(luò)的比較 9641次閱讀
- 前饋神經(jīng)網(wǎng)絡(luò)的工作原理和應(yīng)用 1861次閱讀
- 深度神經(jīng)網(wǎng)絡(luò)與基本神經(jīng)網(wǎng)絡(luò)的區(qū)別 1006次閱讀
- 用于自然語(yǔ)言處理的神經(jīng)網(wǎng)絡(luò)有哪些 1354次閱讀
- 卷積神經(jīng)網(wǎng)絡(luò)與循環(huán)神經(jīng)網(wǎng)絡(luò)的區(qū)別 3582次閱讀
- 深度神經(jīng)網(wǎng)絡(luò)的實(shí)現(xiàn)機(jī)理與決策邏輯難以理解 2994次閱讀
- 循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)和(LSTM)初學(xué)者指南 968次閱讀
- 長(zhǎng)短時(shí)記憶神經(jīng)網(wǎng)絡(luò)的算法 4768次閱讀
- BP神經(jīng)網(wǎng)絡(luò)概述 4.4w次閱讀
- 我們?cè)撊绾?b class="flag-6" style="color: red">理解卷積神經(jīng)網(wǎng)絡(luò)? 9723次閱讀
- 用TensorFlow寫個(gè)簡(jiǎn)單的神經(jīng)網(wǎng)絡(luò) 5179次閱讀
下載排行
本周
- 1電子電路原理第七版PDF電子教材免費(fèi)下載
- 0.00 MB | 1491次下載 | 免費(fèi)
- 2單片機(jī)典型實(shí)例介紹
- 18.19 MB | 95次下載 | 1 積分
- 3S7-200PLC編程實(shí)例詳細(xì)資料
- 1.17 MB | 27次下載 | 1 積分
- 4筆記本電腦主板的元件識(shí)別和講解說(shuō)明
- 4.28 MB | 18次下載 | 4 積分
- 5開(kāi)關(guān)電源原理及各功能電路詳解
- 0.38 MB | 11次下載 | 免費(fèi)
- 6100W短波放大電路圖
- 0.05 MB | 4次下載 | 3 積分
- 7基于單片機(jī)和 SG3525的程控開(kāi)關(guān)電源設(shè)計(jì)
- 0.23 MB | 4次下載 | 免費(fèi)
- 8基于AT89C2051/4051單片機(jī)編程器的實(shí)驗(yàn)
- 0.11 MB | 4次下載 | 免費(fèi)
本月
- 1OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234313次下載 | 免費(fèi)
- 2PADS 9.0 2009最新版 -下載
- 0.00 MB | 66304次下載 | 免費(fèi)
- 3protel99下載protel99軟件下載(中文版)
- 0.00 MB | 51209次下載 | 免費(fèi)
- 4LabView 8.0 專業(yè)版下載 (3CD完整版)
- 0.00 MB | 51043次下載 | 免費(fèi)
- 5555集成電路應(yīng)用800例(新編版)
- 0.00 MB | 33562次下載 | 免費(fèi)
- 6接口電路圖大全
- 未知 | 30320次下載 | 免費(fèi)
- 7Multisim 10下載Multisim 10 中文版
- 0.00 MB | 28588次下載 | 免費(fèi)
- 8開(kāi)關(guān)電源設(shè)計(jì)實(shí)例指南
- 未知 | 21539次下載 | 免費(fèi)
總榜
- 1matlab軟件下載入口
- 未知 | 935053次下載 | 免費(fèi)
- 2protel99se軟件下載(可英文版轉(zhuǎn)中文版)
- 78.1 MB | 537793次下載 | 免費(fèi)
- 3MATLAB 7.1 下載 (含軟件介紹)
- 未知 | 420026次下載 | 免費(fèi)
- 4OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234313次下載 | 免費(fèi)
- 5Altium DXP2002下載入口
- 未知 | 233046次下載 | 免費(fèi)
- 6電路仿真軟件multisim 10.0免費(fèi)下載
- 340992 | 191183次下載 | 免費(fèi)
- 7十天學(xué)會(huì)AVR單片機(jī)與C語(yǔ)言視頻教程 下載
- 158M | 183277次下載 | 免費(fèi)
- 8proe5.0野火版下載(中文版免費(fèi)下載)
- 未知 | 138039次下載 | 免費(fèi)
評(píng)論