OpenCV实战(OCR识别和高级基础)

news/2024/7/7 22:28:11

目录

  • 图像特征
    • harris角点检测
      • 基本原理
      • 实现
    • Scale Invariant Feature Transform(SIFT)
      • 图像尺度空间
      • 多分辨率金字塔
      • 高斯差分金字塔(DOG)
      • DoG空间极值检测
      • 关键点的精确定位
      • 消除边界响应
      • 特征点的主方向
      • 生成特征描述
    • 特征匹配
      • Brute-Force蛮力匹配
      • 1对1的匹配
      • k对最佳匹配
      • 随机抽样一致算法(Random sample consensus,RANSAC)
      • 单应性矩阵

图像特征

harris角点检测

在这里插入图片描述
角点:无论沿水平还是竖直方向移动,灰度级都会发生变化,并且这个变化是迅速的
边界:只有一个方向移动灰度级是迅速的,另一个方向是缓慢的

基本原理

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

实现

cv2.cornerHarris()

  • img: 数据类型为 float32 的入图像
  • blockSize: 角点检测中指定区域的大小
  • ksize: Sobel求导中使用的窗口大小
  • k: 取值参数为 [0,04,0.06]
import cv2 
import numpy as np
def cv_show(img,name):
    cv2.imshow(name,img)
    cv2.waitKey()
    cv2.destroyAllWindows()
    cv2.waitKey(1)
    
img = cv2.imread('./汪学长的随堂资料/7/07and08 OpenCV_高级基础和多个项目实战/高级基础知识/test_1.jpg')
print ('img.shape:',img.shape)
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
# gray = np.float32(gray)
dst = cv2.cornerHarris(gray, 2, 3, 0.04)
print ('dst.shape:',dst.shape)

在这里插入图片描述

img[dst>0.01*dst.max()]=[0,0,255]
cv_show(img,'dst')

在这里插入图片描述

Scale Invariant Feature Transform(SIFT)

图像尺度空间

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

多分辨率金字塔

在这里插入图片描述

高斯差分金字塔(DOG)

在这里插入图片描述
在这里插入图片描述

DoG空间极值检测

为了寻找尺度空间的极值点,每个像素点要和其图像域(同一尺度空间)和尺度域(相邻的尺度空间)的所有相邻点进行比较,当其大于(或者小于)所有相邻点时,该点就是极值点。如下图所示,中间的检测点要和其所在图像的3×3邻域8个像素点,以及其相邻的上下两层的3×3领域18个像素点,共26个像素点进行比较。
在这里插入图片描述

关键点的精确定位

这些候选关键点是DOG空间的局部极值点,而且这些极值点均为离散的点,精确定位极值点的一种方法是,对尺度空间DoG函数进行曲线拟合,计算其极值点,从而实现关键点的精确定位。
在这里插入图片描述

消除边界响应

在这里插入图片描述

特征点的主方向

在这里插入图片描述
每个特征点可以得到三个信息(x,y,σ,θ),即位置、尺度和方向。具有多个方向的关键点可以被复制成多份,然后将方向值分别赋给复制后的特征点,一个特征点就产生了多个坐标、尺度相等,但是方向不同的特征点。

生成特征描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

import cv2
import numpy as np

def cv_show(img,name):
    cv2.imshow(name,img)
    cv2.waitKey()
    cv2.destroyAllWindows()
    cv2.waitKey(1) # MacOS函数
    
img = cv2.imread('./汪学长的随堂资料/7/07and08 OpenCV_高级基础和多个项目实战/高级基础知识/test_1.jpg')
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

得到特征点

sift = cv2.xfeatures2d.SIFT_create()
kp = sift.detect(gray, None)
img = cv2.drawKeypoints(gray, kp, img)

cv_show(img,'drawKeypoints')

在这里插入图片描述
计算特征

kp, des = sift.compute(gray, kp)

des是每个关键点的特征

print (np.array(kp).shape)

在这里插入图片描述

des.shape

在这里插入图片描述

特征匹配

Brute-Force蛮力匹配

import cv2 
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline
img1 = cv2.imread('./汪学长的随堂资料/7/07and08 OpenCV_高级基础和多个项目实战/高级基础知识/box.png', 0)
img2 = cv2.imread('./汪学长的随堂资料/7/07and08 OpenCV_高级基础和多个项目实战/高级基础知识/box_in_scene.png', 0)
cv_show('img1',img1)

在这里插入图片描述

cv_show('img2',img2)

在这里插入图片描述

sift = cv2.xfeatures2d.SIFT_create()
kp1, des1 = sift.detectAndCompute(img1, None)
kp2, des2 = sift.detectAndCompute(img2, None)
# crossCheck表示两个特征点要互相匹,例如A中的第i个特征点与B中的第j个特征点最近的,并且B中的第j个特征点到A中的第i个特征点也是 
#NORM_L2: 归一化数组的(欧几里德距离),如果其他特征计算方法需要考虑不同的匹配计算方式
bf = cv2.BFMatcher(crossCheck=True)

1对1的匹配

matches = bf.match(des1, des2)
matches = sorted(matches, key=lambda x: x.distance)
img3 = cv2.drawMatches(img1, kp1, img2, kp2, matches[:10], None,flags=2)
cv_show('img3',img3)

在这里插入图片描述

k对最佳匹配

bf = cv2.BFMatcher()
matches = bf.knnMatch(des1, des2, k=2)
good = []
for m, n in matches:
    if m.distance < 0.75 * n.distance:
        good.append([m])
img3 = cv2.drawMatchesKnn(img1,kp1,img2,kp2,good,None,flags=2)
cv_show('img3',img3)

在这里插入图片描述

随机抽样一致算法(Random sample consensus,RANSAC)

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

单应性矩阵

在这里插入图片描述


http://lihuaxi.xjx100.cn/news/1455643.html

相关文章

设计模式之门面模式(Facade)的C++实现

1、门面模式提出 在组件的开发过程中&#xff0c;某些接口之间的依赖是比较紧密的&#xff0c;如果某个接口发生变化&#xff0c;其他的接口也会跟着发生变化&#xff0c;这样的代码违背了代码的设计原则。门面设计模式是在外部客户程序和系统程序之间添加了一层中间接口&…

Hands on RL 之 Off-policy Maximum Entropy Actor-Critic (SAC)

Hands on RL 之 Off-policy Maximum Entropy Actor-Critic (SAC) 文章目录 Hands on RL 之 Off-policy Maximum Entropy Actor-Critic (SAC)1. 理论基础1.1 Maximum Entropy Reinforcement Learning, MERL1.2 Soft Policy Evaluation and Soft Policy Improvement in SAC1.3 Tw…

十、RabbitMQ集群

一、clustering 1、 使用集群的原因 单台RabbitMQ遇到内存崩溃、机器故障等情况会导致服务不可用单台RabbitMQ只能满足每秒1000条的消息吞吐量 2、搭建步骤 1、准备三台虚拟机 2、修改3台机器的主机名称 分别为node1、node2、node3 vi /etc/hostname 3、配置节点的hosts文…

TypeScript相关面试题

typeScript 1.什么是TypeScript?是什么&#xff1f;特性&#xff1f;区别&#xff1f; 2.TypeScript数据类型&#xff1f;3.说说你对 TypeScript 中枚举类型的理解&#xff1f;应用场景&#xff1f;4.说说你对 TypeScript 中接口的理解&#xff1f;应用场景&#xff1f;使用方…

【LINUX相关】生成随机数(srand、/dev/random 和 /dev/urandom )

目录 一、问题背景二、修改方法2.1 修改种子2.2 使用linux中的 /dev/urandom 生成随机数 三、/dev/random 和 /dev/urandom 的原理3.1 参考连接3.2 重难点总结3.2.1 生成随机数的原理3.2.2 随机数生成器的结构3.2.3 二者的区别和选择 四、在代码的使用方法 一、问题背景 在一个…

Android Drawable转BitmapDrawable再提取Bitmap,Kotlin

Android Drawable转BitmapDrawable再提取Bitmap&#xff0c;Kotlin <?xml version"1.0" encoding"utf-8"?> <LinearLayout xmlns:android"http://schemas.android.com/apk/res/android"android:layout_width"match_parent"…

JMeter接口测试数据分离驱动应用

步骤&#xff1a; 创建csv文件&#xff0c;编写接口测试用例 新建线程组——创建循环控制器&#xff08;循环次数填用例总数&#xff09; 创建CSV数据文件设置&#xff0c;设置参数。&#xff08;注意&#xff1a;是否允许带引号&#xff1f;&#xff1a;一定要设置为true&a…

windows代理虚机ubuntu中的端口

netsh interface portproxy add v4tov4 listenaddress192.168.31.243 listenport3309 connectaddress192.168.239.177 connectport3309 参考文章&#xff1a;Windows端口代理转发_windows 代理虚拟机端口_weixin_101的博客-CSDN博客