本文从三种不同的角度分析一下VAE的推导。
1. 总则
我们将VAE与GAN都可以放到分布拟合的框架下考虑,简单说,就是有一个未知的真实数据分布,我们想要表示该分布。而VAE最精髓的步骤之一,就是使用隐变量,将数据分布的表征分为两步。
VAE的三种不同推导方法1. 总则2. 从数据分布出现概率最大出发进行推导3. 从联合概率密度出发进行推导4. 从encoder角度进行推导 下面的两张PPT很好的总结了各种不同的生成模型间的联系与差异,可以作为参考
VAE的三种不同推导方法1. 总则2. 从数据分布出现概率最大出发进行推导3. 从联合概率密度出发进行推导4. 从encoder角度进行推导
VAE的三种不同推导方法1. 总则2. 从数据分布出现概率最大出发进行推导3. 从联合概率密度出发进行推导4. 从encoder角度进行推导 2. 从数据分布出现概率最大出发进行推导
既然我们想要真实的数据分布,那就直接来好了,这也是最容易想到的方式
VAE的三种不同推导方法1. 总则2. 从数据分布出现概率最大出发进行推导3. 从联合概率密度出发进行推导4. 从encoder角度进行推导 3. 从联合概率密度出发进行推导
根据1中对VAE的概述,我们知道,VAE本质上是利用隐变量对数据分布进行了抽象,那么我们就希望隐变量与原始数据分布距离我们的学到的尽量靠近
VAE的三种不同推导方法1. 总则2. 从数据分布出现概率最大出发进行推导3. 从联合概率密度出发进行推导4. 从encoder角度进行推导 4. 从encoder角度进行推导
很多时候,VAE是为下游任务做数据预处理和特征提取的,那么就需要有一个良好的encoder,从这个角度出发,也可以得出相同的结论
VAE的三种不同推导方法1. 总则2. 从数据分布出现概率最大出发进行推导3. 从联合概率密度出发进行推导4. 从encoder角度进行推导