超越基准 | 基于每个高斯变形的3D高斯溅射方法及其高效训练策略

作者：Jeongmin Bae | 编辑3DCV

添加微信：dddvision，备注：3DGS，拉你入群。文末附行业细分群

题目：Per-Gaussian Embedding-Based Deformation for Deformable 3D Gaussian Splatting

作者：Jeongmin Bae等

代码：https://jeongminb.github.io/e-d3dgs/

论文链接：https://arxiv.org/abs/2404.03613

1 引言

由于3DGS提供了快速、高质量的新颖视图合成，因此将规范的 3DGS 变形为多个帧是一种自然的扩展。然而，以往的作品未能准确重建动态场景，特别是1）静态部分沿着附近的动态部分移动，以及2）一些动态区域模糊不清。我们将失败归因于变形场的错误设计，变形场是作为基于坐标的函数构建的。这种方法是有问题的，因为 3DGS 是以高斯为中心的多个场的混合体，而不仅仅是一个基于坐标的框架。为了解决这个问题，我们将变形定义为每高斯嵌入和时间嵌入的函数。此外，我们将变形分解为粗变形和细变形，以分别模拟慢速和快速运动。此外，我们还引入了一种高效的培训策略，以实现更快的收敛和更高的质量。

2 主要贡献

为每个高斯分配一个潜在嵌入，用于预测其变形；
将时间变化分解为粗糙和精细变形，分别建模场景中的缓慢和快速运动；
提出了有效的训练策略，包括相机采样、帧采样和多视图DSSIM损失，以提高收敛速度和性能。

3 方法

图2：框架现有的基于场的变形方法在从高斯坐标映射变形参数变化时，会遭受附近高斯之间的纠缠。为了解决这个问题，我们定义了基于每个高斯的变形。首先，我们为每个高斯分配一个潜在嵌入。此外，我们还引入了粗时间和细时间嵌入来表示动态场景的慢速和快速状态。通过使用两个解码器，它们分别输入每个高斯的潜在嵌入和粗时间嵌入，以及每个高斯的潜在嵌入和细时间嵌入，我们估计慢速或大变化以及快速或细节变化，分别建模最终的变形。

如图所示作者提出的方法，包括以下几个关键点：

基于嵌入的变形(Embedding-Based Deformation): 作者为每个高斯函数分配一个32维的潜在嵌入，用于表示该高斯函数随时间的变形。同时，引入了一个256维的时间嵌入，表示不同帧的状态。通过将每个高斯函数的嵌入和对应帧的时间嵌入作为输入，预测每个高斯函数的参数变化，从而实现基于嵌入的变形。

粗细变形(Coarse-Fine Deformation): 作者将时间变化分解为粗变形和细变形。粗变形负责表示场景中的大运动或慢运动，而细变形则学习粗变形无法覆盖的快运动或细节运动。通过两个不同时间分辨率的变形网络来实现这一方案。

高效训练策略(Efficient Training Strategy): 为了加速收敛，作者提出了一种高效的训练策略，包括均匀覆盖多视角、基于误差采样难训练帧，以及通过多视角DSSIM损失诱导高斯密化。

4 实验

根据文档内容，【4 Experiment】部分主要介绍了作者进行的实验验证和分析，包括以下几个方面：

实验验证：作者在Neural 3D Video、Technicolor Light Field和HyperNeRF数据集上进行了验证实验，并选择了相应基准进行比较。实验结果显示，该方法在动态区域重建质量、捕捉细节和计算效率等方面明显优于基准方法。

分析：作者分析了粗细变形网络的作用，并进行了可视化。结果表明，粗变形负责捕捉大运动，而细变形负责捕捉小运动。同时，作者进行了ablation study，结果表明去除粗变形或细变形网络都会降低性能。

高效训练策略：作者分析了高效训练策略中相机采样、基于误差的帧采样和多视角DSSIM损失的作用。实验结果显示，这些策略可以加快收敛，提高性能。

局限性：作者讨论了方法的局限性，如快运动区域的模糊问题，并提出了改进方向。

5 总结

这篇文章提出了一种基于高斯嵌入的变形方法，用于动态三维高斯溅射(3DGS)。实验结果表明，该方法在动态区域重建、细节捕捉和挑战性相机设置下表现出色，优于多个基线方法。

本文仅做学术分享，如有侵权，请联系删文。

在这里给大家推荐3D视觉工坊联合Gigi主讲老师推出的新课《基于NeRF/Gaussian三维重建的全新SLAM算法》

主讲人介绍

课程大纲

课程亮点

本门课程从理论和代码实现两方面展开，带你从零入门NeRF/Gaussian Based SLAM的原理学习、论文阅读、代码梳理等。
理论层面，从线性代数入手到传统的计算机图形学，让大家明了现代三维重建的理论基础和源头；
代码层面通过多个练习手把手教会大家复现计算机图形学、NeRF相关工作。

学后收获

入门基于NeRF/Gaussian的SLAM领域
学会如何在快速抓取一篇论文的关键点和创新点
如何快速跑通一篇论文的代码并结合代码掌握论文的思想
逐行NeRF代码进行解析，掌握每个实现细节，并手动复现并作改进

课程设置

系统要求：Linux
编程语言：Python
基础要求：有Python、PyTorch基础

适合人群

对一篇新论文配套开源代码无从下手的小白
SLAM定位建图、NeRF三维重建小白
从事三维重建工作的人员可参考
NeRF论文的初始阅读者
对SLAM、NeRF感兴趣的学员

开课时间

2024年2月24日晚上8点（周六），每周更新一章节。

课程答疑

本课程答疑主要在本课程对应的鹅圈子中答疑，学员学习过程中，有任何问题，可以随时在鹅圈子中提问。

▲添加小助理：cv3d007，咨询更多

超越基准 | 基于每个高斯变形的3D高斯溅射方法及其高效训练策略

继续阅读

【三浦植造旅行收纳袋】7件套39.9元！面料加厚升级，结实耐用，防水防潮！大容量收纳，卡扣设计，不易变形！

六面兽：洗白弱三分？提起六面兽，熟悉变形金刚的朋友一定印象深刻，尽管当年《头领战士》动画不像上译版G1动画那样普及，但大

向佐为郭碧婷和向太庆祝母亲节，网友声称P图太过分了，脸变形了

游泳队奥运遭遇重大打击！覃海洋受伤致动作变形，长期疲劳导致

向佐陪妻子和向太过母亲节，女儿颜值高像奶奶，郭碧婷被美颜变形

向佐晒全家福庆母亲节，美颜开最大，郭碧婷和向太脸都变形了！

向佐发文庆祝母亲节，狠开美颜郭碧婷变形到认不出，笑晕在评论区

孟子义铲石记：岭南版“变形记”还是“晒黑记”？

台积电上演“变形记”？两个消息传来，人民日报:抛弃幻想

45个！回民区老旧小区“变形记”正在上演

23 岁女生的出租房变形记，现代简约风的价值探讨！

测试开发新技能：Oracle到高斯数据库的无缝迁移

向佐母亲节发微博庆祝，郭碧婷脸部变形到几乎认不出，引网友吐槽

变形计男主人公现状，从“真香定律”到人生赢家：王境泽逆袭之路

真香王境泽？你以为只是真香？《变形计》的成长密码解锁！

公交车变身安全出行课堂，幼儿园小朋友遇见公交“变形金刚”