3D视觉应用研发系列笔记——机器人3D互动（一.技术难点分析）

先回顾一下需要达成的应用场景：简单说就是利用3D视觉传感技术实现人与机器之间的投球互动。玩家从“准备区”投出皮球，经过约半秒时间穿过飞行区，到达回球平面时，机械手对准来球将其推回。如下图所示：

咋一看，这个功能并不复杂，但实现起来非常有挑战性。我们先理一下方案的大致思路：用3D视觉传感器（即深度相机）对球进行跟踪定位，然后通过图像处理尽快的预测出球抵达回球平面时的具体位置，并发送给机器人控制器，再由控制器发出运动指令，机械臂执行到指定位置回击球。

有小伙伴可能会问了，为什么要预测位置，我们不能在球抵达平面时，直接从图像中计算出实际位置吗？显然是不行的，因为时间上来不及。图像传输，图像处理，机械运动都需要时间，这几部分加起来大约 210毫秒，如果等球到了再判断，黄花菜都凉了。所以只能提前根据球进入飞行区的初始6帧的深度图，计算出球在每一帧的位置，再根据这6个位置拟合抛物线，从而得到球抵达回球平面时的具体位置和时间。所以切记，这部分计算能快尽量快，时间就是生命线！

3D视觉应用研发系列笔记——机器人3D互动（一.技术难点分析）

初步估计，球飞行时间约400550ms，扣除6帧飞拍所需的180ms，剩余220370ms，可用于视觉系统处理和机器人响应（需要约210ms，刚刚够），能给到各个环节的时间是很紧张的，如果某个环节稍微入不敷出，这个功能就实现不了。所以，第一个挑战就是如何保证实时性。

挑战二，就是上边提到的位置预测误差。这个预测位置如果不够准确的话，机器人回击球会失败。仔细分析的话，这个误差的构成因素有很多。这里主要列举：像素精度，标定误差，圆拟合误差，抛物线拟合误差，时间误差。

像素精度，是指每一个像素代表的实际尺寸。比如，当VGA分辨率（640480）对应的区间大小为 21.5米，那么每个像素的实际尺寸就是3.1mm。这个尺寸如果越大，从图像中计算的位置误差也就越大。

标定误差，是指每一个像素映射到实际空间中的坐标时，会偏离实际值。一方面，坐标转换矩阵不一定很准确，而且，每个相机的个体之间有差异；另一方面，现场的相机安装有时会有轻微松动异位，那么转换矩阵就实效了。

拟合误差。由于球的快速运动产生拖影（见图），造成圆拟合后的球心位置有误差；另外，由于点云数据丢失，球的成像会出现孔洞，这给圆拟合算法带来挑战。

3D视觉应用研发系列笔记——机器人3D互动（一.技术难点分析）

抛物线拟合误差。在我们利用6帧的球心位置来拟合一条抛物线时，由于理论几何模型与实际有差异，会带来额外的定位误差，且该误差有可能很大。

时间误差。即便预测到的位置非常准确，但如果抵达时间预测得不准，会导致机械臂击球节奏的丢失，也无法满足功能。这个误差的诱因可能是图像传输和图像处理的耗时不稳定，也可能是抛物线模型不准确。

挑战三，图像处理算法。图像处理包括图像去背景噪声，圆拟合。如果背景噪声不能去除干净的话，会造成把背景物体识别为球的情况。但也不能去除的太“狠”，造成球像素的受损，也会影响定位准确性。圆拟合可以采用2D平面拟合，或者3D球面拟合；前者鲁棒性和定位能力差一些，后者会比较耗时。

战四，机器人运动控制、路径规划。一方面要足够块，另一方面要根据来球的速度矢量，设计好机械臂出击的方向和力道，使得回击球的效果最优。

综上所述，这四大挑战决定了这个应用研发的难度不小，因为它不是单纯的理论研究，而是要实现一个工程，就必然受到时间和空间上的强约束。但我们不畏惧困难，要相信办法总比困难多后续几篇笔记会介绍些应对方法。

备注：

点击下面链接，进入奥比中光开发者社区，了解更多3D视觉技术信息：

https://developer.orbbec.com.cn/

或扫描下方二维码,进入奥比中光开发者社区：

3D视觉应用研发系列笔记——机器人3D互动（一.技术难点分析）

3D视觉应用研发系列笔记——机器人3D互动（一.技术难点分析）

继续阅读

证券从业合格证书什么时候打印？有哪些注意事项？

【干货满满】初级银行从业考试《个人理财》重点梳理

2020年经济师考试，难吗？

初级银行从业资格证有什么用？

MBA提前面试纯干货分享

MBA值得学么

申请评分模型拒绝推断（RI）方法申请评分模型拒绝推断（RI）方法

吴恩达logistic回归实现

【人工智能行业大师访谈1】吴恩达采访 Geoffery Hinton

深度学习模型分析人类复杂疾病的准确性

【趋高机器视觉】机器视觉技术原理解析及解决方案

吴恩达 coursera ML 第七课总结+作业答案前言目录正文模型表示作业答案

XGBoost Plotting API以及GBDT组合特征实践 XGBoost Plotting API以及GBDT组合特征实践

解码器用于语义分割：数据依赖的解码可以实现灵活的特征聚合

2021-2025年中国运动疗法（KT）带行业市场供需与战略研究报告

cs231n斯坦福基于卷积神经网络的CV学习笔记（一）KNN和线性分类器/分类器损失/反向传播一，KNN图像分类算法二，线性分类器三，线性分类器损失四，反向传播五，神经网络