机器人视觉的九大挑战

news/2024/7/7 20:32:44

点击上方“小白学视觉”,选择加"星标"或“置顶

重磅干货,第一时间送达

本文转自:新机器视觉

机器人视觉解决方案是我们实现机器人视野的几大挑战。即便变得越来越简单易用,还是有一些棘手的问题。很多因素影响机器人在环境中的视觉,任务设置和工作场所。这里有9个总结出来的机器人视觉挑战:

照明

如果有过在低光照下拍摄数码照片的经验,就会知道照明至关重要。糟糕的照明会毁掉一切。成像传感器不像人眼那样适应性强或敏感。如果照明类型错误,视觉传感器将无法可靠地检测到物体。

有各种克服照明挑战的方法。一种方法是将有源照明结合到视觉传感器本身中。其他解决方案包括使用红外照明,环境中的固定照明或使用其他形式的光的技术,例如激光。

变形或铰接

球是用计算机视觉设置来检测的简单对象。你可能只是检测它的圆形轮廓,也许使用模板匹配算法。但是,如果球被压扁,它会改变形状,同样的方法将不再起作用。这是变形。它会导致一些机器人视觉技术相当大的问题。

铰接类似,是指由可移动关节引起的变形。例如,当您在肘部弯曲手臂时,手臂的形状会发生变化。各个链接(骨骼)保持相同的形状,但轮廓变形。由于许多视觉算法使用形状轮廓,因此清晰度使得物体识别更加困难。

职位和方向

机器人视觉系统最常见的功能是检测已知物体的位置和方向。因此,大多数集成视觉解决方案通常都克服了这两者面临的挑战。

只要整个物体可以在摄像机图像内被查看,检测物体的位置通常是直截了当的。许多系统对于对象方向的变化也是强健的。但是,并不是所有的方向都是平等的。虽然检测沿一个轴旋转的物体是足够简单的,但是检测物体何时3D旋转则更为复杂。

背景

图像的背景对物体检测的容易程度有很大的影响。想象一个极端的例子,对象被放置在一张纸上,在该纸上打印同一对象的图像。在这种情况下,机器人视觉设置可能不可能确定哪个是真实的物体。

完美的背景是空白的,并提供与检测到的物体良好的对比。它的确切属性将取决于正在使用的视觉检测算法。如果使用边缘检测器,那么背景不应该包含清晰的线条。背景的颜色和亮度也应该与物体的颜色和亮度不同。

闭塞

遮挡意味着物体的一部分被遮住了。在前面的四个挑战中,整个对象出现在相机图像中。遮挡是不同的,因为部分对象丢失。视觉系统显然不能检测到图像中不存在的东西。

有各种各样的东西可能会导致遮挡,包括:其他物体,机器人的部分或相机的不良位置。克服遮挡的方法通常涉及将对象的可见部分与其已知模型进行匹配,并假定对象的隐藏部分存在。

比例

在某些情况下,人眼很容易被尺度上的差异所欺骗。机器人视觉系统也可能被他们弄糊涂了。想象一下,你有两个完全相同的物体,只是一个比另一个大。想象一下,您正在使用固定的2D视觉设置,物体的大小决定了它与机器人的距离。如果您训练系统识别较小的物体,则会错误地检测到两个物体是相同的,并且较大的物体更接近相机。

尺度的另一个问题,也许不那么明显,就是像素值的问题。如果将机器人相机放置得很远,则图像中的对象将由较少的像素表示。当有更多的像素代表对象时,图像处理算法会更好地工作,但有一些例外。

照相机放置

不正确的相机位置可能会导致以前出现过的任何问题,所以重要的是要正确使用它。尝试将照相机放置在光线充足的区域,以便在没有变形的情况下尽可能清楚地看到物体,尽可能靠近物体而不会造成遮挡。照相机和观看表面之间不应有干扰的背景或其他物体。

运动

移动有时会导致计算机视觉设置出现问题,特别是在图像中出现模糊时。例如,这可能发生在快速移动的传送带上的物体上。数字成像传感器在短时间内捕获图像,但不会瞬间捕获整个图像。如果一个物体在捕捉过程中移动太快,将导致图像模糊。我们的眼睛可能不会注意到视频中的模糊,但算法会。当有清晰的静态图像时,机器人视觉效果最佳。

期望

与视觉算法的技术方面相比,最后的挑战更多地涉及到您的视觉设置方法。机器人视野面临的最大挑战之一就是工作人员对于视觉系统能提供什么不切实际的期望。通过确保期望符合技术的能力,您将从技术中获得最大收益。您可以通过确保员工接受关于视觉系统的教育来实现这一点。

下载1:OpenCV-Contrib扩展模块中文版教程

在「小白学视觉」公众号后台回复:扩展模块中文教程即可下载全网第一份OpenCV扩展模块教程中文版,涵盖扩展模块安装、SFM算法、立体视觉、目标跟踪、生物视觉、超分辨率处理等二十多章内容。

下载2:Python视觉实战项目52讲

在「小白学视觉」公众号后台回复:Python视觉实战项目即可下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别等31个视觉实战项目,助力快速学校计算机视觉。

下载3:OpenCV实战项目20讲

在「小白学视觉」公众号后台回复:OpenCV实战项目20讲即可下载含有20个基于OpenCV实现20个实战项目,实现OpenCV学习进阶。

交流群

欢迎加入公众号读者群一起和同行交流,目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群(以后会逐渐细分),请扫描下面微信号加群,备注:”昵称+学校/公司+研究方向“,例如:”张三 + 上海交大 + 视觉SLAM“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告,否则会请出群,谢谢理解~


http://lihuaxi.xjx100.cn/news/280424.html

相关文章

android dslr控制软件,DSLR Controller

DSLR Controller中文名字是单反控制器,是一款专业的单反手机控制端软件,用户可以使用该手机软件控制单反,调节单反的相关数据,控制拍摄,非常方便,需要的可以下载使用!软件简介DSLR Controller是…

BFS之三(单向bfs和康托压缩)

//poj 1077 Eight#include <iostream> //单向bfs和康托压缩#include<string>using namespace std;bool visited[1000000];int fac[]{1,1,2,6,24,120,720,5040,40320,362880}; //9!表int cantor(int arr[]) {int temp,num1; //当排列为…

Python实现环形链表详解

这篇文章主要为大家详细介绍了Python实现环形链表&#xff0c;文中示例代码介绍的非常详细&#xff0c;具有一定的参考价值&#xff0c;感兴趣的小伙伴们可以参考一下 本文实例为大家分享了Python实现环形链表的具体代码&#xff0c;供大家参考&#xff0c;具体内容如下 我们将…

为什么数据科学不值得?

作者 | Dario Radečić 译者 | 陈思 本应是 21 世纪最热门的工作&#xff0c;实际上却可能没有那么火爆。数据科学已经陪伴我们一段时间了&#xff0c;它已经不再只是一个热门词汇。人们和公司都利用它创造了价值和金钱&#xff0c;但它真的是未来的职业吗&#xff1f; 作者注…

干货 | OpenCV中KLT光流跟踪原理详解与代码演示

点击上方“小白学视觉”&#xff0c;选择加"星标"或“置顶”重磅干货&#xff0c;第一时间送达本文转自&#xff1a;opencv学堂稀疏光流跟踪(KLT)详解在视频移动对象跟踪中&#xff0c;稀疏光流跟踪是一种经典的对象跟踪算法&#xff0c;可以绘制运动对象的跟踪轨迹与…

时间序列的建模新思路:清华、李飞飞团队等提出强记忆力E3D-LSTM网络

作者 | Yunbo Wang,、Lu Jiang、 Ming-Hsuan Yang、Li-Jia Li、Mingsheng Long、Li Fei-Fei译者 | 凯隐编辑 | Jane出品 | AI科技大本营&#xff08;ID&#xff1a;rgznai100&#xff09;【导读】如何对时间序列进行时空建模及特征抽取&#xff0c;是RGB视频预测分类&#xff0…

Spring Cloud Consul 之Greenwich版本全攻略

点击上方“方志朋”&#xff0c;选择“置顶或者星标”你的关注意义重大&#xff01;什么是ConsulConsul是HashiCorp公司推出的开源软件&#xff0c;使用GO语言编写&#xff0c;提供了分布式系统的服务注册和发现、配置等功能&#xff0c;这些功能中的每一个都可以根据需要单独使…

html5 原生 弹窗,一起来看 HTML 5.2 中新的原生元素 dialog

不到一个月前&#xff0c;HTML 5.2 正式成为 W3C 的推荐标准(REC),其中&#xff0c;推出了一个新的原生模态对话框元素 &#xff0c;乍一看&#xff0c;可能感觉它就是一个新增的元素&#xff0c;然而&#xff0c;作者最近在玩的时候&#xff0c;发现它确实是一个值得期待和很有…