PredNet --- Deep Predictive coding networks for video prediction and unsupervised learning --- 論文筆記

2021-11-16 09:07:31

PredNet --- Deep Predictive coding networks for video prediction and unsupervised learning ICLR 2017

2017.03.12

Code and video examples can be found at: https://coxlab.github.io/prednet/

摘要：基于監督訓練的深度學習技術取得了非常大的成功，但是無監督問題仍然是一個未能解決的一大難題（從未标注的資料中學習到一個領域的結構）。本文探索了無監督學習中關于 video prediction 的問題。設計了一種 “PredNet”結構，實作了該項工程，并且得到了非常喜人的實驗結果。實驗結果表明：預測代表了一種非常強大的無監督學習架構，可以潛在的學習到物體或者場景結構。

網絡設計：

PredNet --- Deep Predictive coding networks for video prediction and unsupervised learning --- 論文筆記

　　如上圖所示的流程，是有一系列的子產品堆疊在一起産生的。該網絡首先進行局部預測，然後減去真實的輸入，傳到下一層。

　　簡單的說，每個子產品可以分為 4 個部分：

　　1. 一個輸入卷積層 $A_l$

　　2. 循環表示層 $R_l$

　　3. 預測層 $\hat{A}_l $

　　4. 誤差表示層 $E_l$

　　 $R_l$ 是一個循環卷積網絡産生一個預測 A^l，layer的輸入是 Al。網絡計算 Al 和 A^l 的不同，然後輸出一個誤差表示 El, 分為單獨修正的 positive 和 negative error 傳遞。将該誤差 El 傳遞給卷積層，作為下一層的輸入 $A_{l+1}$。$R_l$ 子產品有兩個輸入，分别來自于：直接拷貝過來的 El，以及下一層 $R_{l+1}$ 的輸入。

　　這個網絡可以分為兩個最重要的部分來看，左邊 Rl 部分是循環産生式反卷積網絡；右邊 Al 和 El 是标準的深度卷積網絡。

　　該模型訓練的目标是：minimize the weighted sum of the firing rates of the error units. 此處的 error units 類似于 L1 error. 雖然此處沒有嘗試，但也可以嘗試其他的 loss function。

　　總的算法架構如下：

　　實驗部分：

PredNet --- Deep Predictive coding networks for video prediction and unsupervised learning --- 論文筆記

繼續閱讀

Codeforces 1417 D. Make Them Equal(思維+構造)

查找算法之二分查找查找算法之二分查找

查找算法學習之二分查找（Python版本）——BinarySearch

CQ V1.0分詞bates(基于雙數組tire樹)—應該是目前最快的中文分詞算法

Command Network(POJ 3164)---定根最小樹形圖模闆題題目描述輸入格式輸出格式輸入樣例輸出樣例分析源程式

開源低帶寬語音編解碼器

241 Different Ways to Add Parentheses（C代碼版）

【趨高機器視覺】機器視覺技術原了解析及解決方案

CSMA/CD1． CSMA/CD的概述2． CSMA 的工作原理3． CSMA/CD控制規程及特點4． CSMA/CD協定5． CSMA/CD的優點6．結束語

極大似然法(ML)與最大期望法(EM)

C++ 第十五周報告1--《冒泡法排序》

筆試面試題目：滑動視窗(二)

資料結構與算法（27）——排序（二）

Dijkstra--簡易版（最短路徑）

GitHub連夜封殺！這份阿裡 10W 字内部 Java 字面試手冊到底有多強？

hdu7108哈希