图像处理分类、一般流程与算法

news/2024/7/7 21:19:08

点击上方“小白学视觉”,选择加"星标"或“置顶

重磅干货,第一时间送达本文转自|新机器视觉

常用的图像处理算法:数字图像处理基础、遥感数字图像处理、机器视觉、计算机视觉

图像处理程序:C++ OpenCV、Matlab与图像处理

数字图像处理-概述

其实,造成“不可能图形”(三角形的三个角都是90°)的并不是图形本身,而是你对图形的三维知觉系统,这一系列在你知觉图形的立体心理模型时强制作用。在把二维平面图形知觉为你三维立体心理图形时,执行这一过程的机制会极大地影响你的视觉系统。

正是在这一强制执行的机制的影响下,你的视觉系统对图形中的每一个点都赋予了深度。换句话说,一幅图像的某些二维结构元素和你三维知觉解释系统的某些结构元素相对应。二维直线被解释成三维直线。二维的平面被解释为三维的平面。在透视图像中,锐角和钝角都被解释为90°角。外面的线段被看作是外形轮廓的分界线。这一外形分界线在你定义整个心理图像的外形轮廓时起着及其重要的作用。这说明,在没有相反信息的影响下,你的视觉系统总是假定你从一个主要视角观看事物。

三角形的每一个顶角都产生透视,三个90°的角,而且,每条边的距离变化不同。把三个顶角合成一个整体,就产生了一个空间不可能图形。

相对性:环境对比的影响

计算机视觉的发展历史:

1950s:二维图像分析和识别,如光学字符识别,工件表面、显微图片和航空图片的分析和解释等。是模式识别的重要内容。

1960s:MIT的Roberts通过计算机程序从数字图像中提取出诸如立方体、楔形体、棱柱体等多面体的三维结构,并对物体形状及物体的空间关系进行描述.这项研究开创了以理解三维场景为目的的三维计算机视觉的研究.Roberts对积木世界的创造性研究给人们以极大的启发,许多人相信,一旦由白色积木玩具组成的三维世界可以被理解,则可以推广到理解更复杂的三维场景.

1970s:出现了一些视觉应用系统.

-70年代中期,麻省理工学院(MIT)人工智能(AI)实验室正式开设“计算机视觉” ( Machine Vision) 课程,由B.K.P.Horn教授讲授.

-David Marr教授于1973年应邀在MIT AI 实验室领导一个以博士生为主体的研究小组,1977年提出了不同于“积木世界”分析方法的计算视觉理论.

1980s:Marr理论成为计算机视觉研究领域中的一个十分重要的理论框架.(ICCV, Marr奖)

计算机视觉获得蓬勃发展,新概念、新方法、新理论、新应用不断涌现,比如,基于感知特征群的物体识别理论框架,主动视觉理论框架,视觉集成理论框架等.

Marr模型

80年代初,Marr首次从信息处理的角度综合了图像处理、心理物理学、神经生理学及临床神经病理学的研究成果,提出了第一个较完备的视觉系统框架。

Marr将系统分为基元图、2.5维图(部分的、不完整的三维信息,缺少深度信息)和三维模型三个层次来表达视觉信息的处理过程,而每层的表达将适当的信息明朗化。

基元图:使亮度变化(边沿)的信息明朗化,如角点、边缘、纹理、线条、边界等基本特征。

2.5维图:使表面朝向的信息明朗化,如场景可见部分的深度、法线方向、轮廓等。

三维模型:物体的形状与空间位置信息明朗化。

优点:系统地阐述了用二维图像恢复三维物体的可能性和一般性方法。

缺点:没有考虑视觉本身具有的反馈机制和不同层次的处理力度。

计算机视觉(Computer Vision)与相关学科的关系

- 图像处理 (Image Processing) 图像处理通常是把一幅图像变换成另外一幅图像,也就是说,图像处理系统的输入是图像,输出仍然是图像,信息恢复任务则留给人来完成。

- 计算机图形学 (Computer Graphics) 通过几何基元,如线、圆和自由曲面等,来生成图像,属于图像综合,它在可视化(Visualization)和虚拟现实(Virtual Reality)中起着很重要的作用.计算机视觉正好是解决相反的问题,即从图像中估计几何基元和其它特征,属于图像分析.

- 模式识别 (Pattern Recognition) 研究分类问题,确定符号、图画、物体等输入对象的类别.强调一类事物区别于其它事物所具有的共同特征。一般不关心三维世界的恢复问题。

- 人工智能 (Artificial Intelligence) 涉及到智能系统的设计和智能计算的研究.在经过图像处理和图像特征提取过程后,接下来要用人工智能方法对场景特征进行表示,并分析和理解场景.

- 媒体计算 (Multimedia Computing) 文字\图形\图像\动画\视频\音频等各类感觉媒体的共性基础计算理论、计算方法,以及媒体系统实现技术。以实现下一代计算机能听、能看、会说、会学习为目标。

- 认知科学与神经科学 (Cognitive science and Neuroscience) 将人类视觉作为主要的研究对象.计算机视觉中已有的许多方法与人类视觉极为相似.许多计算机视觉研究者对研究人类视觉计算模型比研究计算机视觉系统更感兴趣,希望计算机视觉更加自然化,更加接近生物视觉

图信号处理层次

-  图像处理:图像采集、储存;图像重建;图像变换、增强、恢复、校正;图像(视频)压缩编码。
-  图像分析:边缘检测、图像分割;目标表达、描述;目标颜色、形状、纹理、空间和运动分析;目标检测、识别。
-  图像理解:图像配准、融合;3-D表示、建模、场景恢复;图像感知、解释、推理;基于内容的图像和视频检索。

计算机视觉技术的应用

-   工业领域(生产装配、质量检验)
-   机器人(星球探测机器人)
-   遥感图像分析(植被分析)
-   医学图像分析(骨骼定位)
-   安全鉴别、监视与跟踪(门禁系统、视频监控)
-   国防系统(目标自动识别与目标跟踪)
-   图像与视频检索(基于内容的检索)
-   文物保护(数字博物馆)
-   其他(游戏、动画、体育、人机交互)

本文转自:博客园 - 2008nmj,转载此文目的在于传递更多信息,版权归原作者所有。

 End 

下载1:OpenCV-Contrib扩展模块中文版教程

在「小白学视觉」公众号后台回复:扩展模块中文教程即可下载全网第一份OpenCV扩展模块教程中文版,涵盖扩展模块安装、SFM算法、立体视觉、目标跟踪、生物视觉、超分辨率处理等二十多章内容。

下载2:Python视觉实战项目52讲

在「小白学视觉」公众号后台回复:Python视觉实战项目即可下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别等31个视觉实战项目,助力快速学校计算机视觉。

下载3:OpenCV实战项目20讲

在「小白学视觉」公众号后台回复:OpenCV实战项目20讲即可下载含有20个基于OpenCV实现20个实战项目,实现OpenCV学习进阶。

交流群

欢迎加入公众号读者群一起和同行交流,目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群(以后会逐渐细分),请扫描下面微信号加群,备注:”昵称+学校/公司+研究方向“,例如:”张三 + 上海交大 + 视觉SLAM“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告,否则会请出群,谢谢理解~


http://lihuaxi.xjx100.cn/news/274660.html

相关文章

js回调与异步加载的用法

以前还是菜鸟的时候(虽然现在依然很菜 -_-|| )对异步加载与回调函数的技术无比向往,但也一直没有使用过,这次因为页面逻辑太过复杂,一堆请求逻辑,如果还是用顺序请求,页面的速度。。。 领导又要…

feign调用如何传递token_走进Spring Cloud之五 eureka Feign(服务调用者)

FeignFeign是一个声明式、模板化的HTTP客户端。它使得写Http客户端变得更简单。使用Feign,只需要用JAX-RS或Spring MVC注解创建可以实现的动态接口。微服务之间的调用本质还是http请求,如果对于每个请求都需要写请求代码,增加请求参数&#x…

中国高校4篇研究今日同时登上Nature!清华北大上交浙工大等在列

金磊 发自 凹非寺 量子位 报道 | 公众号 QbitAI最新一期的Nature,可谓是「中国高校大爆发」。同一天,清华大学、北京大学、上海交通大学和浙江工业大学等中国高校,在学术顶刊Nature上各发表了一篇研究。清华大学:小鼠胚胎中RNA聚合…

html 打印时隐藏,html 打印相关操作与实现详解

原理为调用 window.print() 方法,但是该方法只能对当前页面全部打印,所以有了以下方案来解决局部打印1: 利用 iframe 将需要打印的元素和样式注入 再调用打印// 示例代码function print () {let ifElement document.getElementById(ifId)const addHtmlP…

3月6日工作日志-88250

今天: 1. 与zy、vanessa一起使用mingle做了开发计划 2. 使用了XStream重写了XML格式的Dynamic Dictionary Basic Engine TODO: 1. 提高Dynamic Dict引擎的效率 2. 分片转换一部43W词汇的英-中词库(按字母、大小写分片) 转载于:https:/…

项目实践:SpringBoot三招组合拳,手把手教你打出优雅的后端接口

点击上方“方志朋”,选择“设为星标”回复”666“获取新整理的面试文章来源:juejin.im/post/5e7ab0bae51d45271b749815前言一个后端接口大致分为四个部分组成:接口地址(url)、接口请求方式(get、post等&…

Python是世界上最好的语言,你不服不行!(附资料)

今天我们要讲 4 个关于 Python 的故事,来看看人工智能时代中的 Python。 粉丝福利:私信回复【01】,有python入门教程一套 如果想成为一名程序员?快点学会Python 想要高薪吗?那就来学习 Python 吧! Python…

不要痴迷蓝牙耳机了,出门选这个准没错,99W+人的选择

01有一种耳机啊它是真的不适合在长途火车上使用那就蓝牙耳机除非你带充电宝还有一种耳机啊它是真的不适合丢那就是带有充电仓的耳机因为充电仓丢了这个耳机基本上就废了02这不,我就经历了,活生生的例子出差的路上在火车上把耳机充电仓给弄丢了只剩孤零零…