立体视觉匹配（Stereo Matching/stereo correspondence）

2023-04-20 20:52:14

该问题的任务是从双目相机所获取的左眼图像和右眼图像中恢复出逐像素点的深度。由于双目相机中的平行极线约束，该问题又转化为左右眼图之间的逐像素匹配问题。

受限于训练数据的数量，同时也因为可能未找到该问题下的最佳网络结构，深度学习中的端到端的训练方法在立体视觉匹配上的表现依然未超过传统方法。这里的端到端的训练方法指的是：直接对输入图片进行一系列卷积以及一系列反卷积来回归出输出图像。由于获得双目图像的ground truth深度数据本身就是一个难题，目前立体视觉匹配两个主要benchmark Middlebury和KITTI上也分别只有数十对和数百对的训练数据，对训练端到端的深度估计网络还远远不够。

为了解决这个难题，TUMCremers团队在另一篇论文中讨论了如何生成足够且靠谱的训练数据用以训练深度估计网络：A Large Dataset to Train Convolutional Networks for Disparity, Optical Flow, and Scene Flow Estimation， Nikolaus Mayer, Eddy Ilg, Philip Häusser, Philipp Fischer,Daniel Cremers, Alexey Dosovitskiy, Thomas Brox。该论文使用开源的3D Creation Suite Blender渲染出一系列带有复杂运动模式的物体的双目图片，由于渲染过程是从3D到2D且物体及场景的三维模型已知，生成ground truth的深度图变得非常容易。生成的训练数据集中包含35,000对训练样本，训练得到的深度估计网络在KITTI上的排名也比较靠前，但离第一名传统方法Displet仍有相当一段距离。这里值得一提的是，虽然该网络使用人工合成的数据集进行训练，它在真实数据集上似乎具有良好的泛化能力。随着训练数据的不断完善，深度网络在几个重要的低层视觉问题上是否会超越以及如何超越传统方法，又或者能给传统解法带来什么样的启发，我们拭目以待。

CVPR在疯狂的深度学习热潮中依然保持着对传统能量优化问题的重视。其中一个重要原因可能是，尽管深度神经网络在中高层视觉中已所向披靡，但其在底层视觉的一些问题中仍未超越传统方法，例如去噪、光流、以及立体视觉匹配。

http://www.xuebuyuan.com/1541954.html

立体视觉匹配（Stereo Matching/stereo correspondence）

继续阅读

基于Ubuntu的ORB-SLAM2项目环境搭建过程

“前置双目立体视觉影像系统”带来自拍体验新玩法！目前，市面上绝大多数手机的影像重点多放在后置，而前置影像体验的提升幅度却

现在和朋友出门拍照，大家都会躲着苹果手机，这就尴尬了。早就听身边的朋友说国产手机的影像强，我还不信，但直到被种草了Hin

vs2017+opencv3.2.0+pylon5.0.10

鉴智机器人推出双目立体视觉智能驾驶系统

中华文化，是世界文化的灵魂所在，大美璀璨，象一棵硕果累累的大树。中华文化之树，道为根，德为干，三教为大杈，百家为小枝，枝

【双目视觉探索路6】整体代码结构分析与作业完成（未完待续）书中框架结构介绍StereoCalib开放接口StereoCalib内部分析

【双目视觉探索路1】立体视觉的基本原理参考资料：立体视觉的相关原理梳理：

Binocular Disparity map 双目视差图

格雷码结构光（用于立体视觉）原理详解+结构光编码实现

对视频序列的运动检测目标跟踪（运动目标的检测与跟踪）

MFC+opencv双目测距