干货 | OpenCV中KLT光流跟踪原理详解与代码演示

news/2024/7/7 21:15:45

点击上方“小白学视觉”,选择加"星标"或“置顶

重磅干货,第一时间送达

本文转自:opencv学堂

稀疏光流跟踪(KLT)详解

在视频移动对象跟踪中,稀疏光流跟踪是一种经典的对象跟踪算法,可以绘制运动对象的跟踪轨迹与运行方向,是一种简单、实时高效的跟踪算法,这个算法最早是有Bruce D. Lucas and Takeo Kanade两位作者提出来的,所以又被称为KLT。KLT算法工作有三个假设前提条件:

  • 亮度恒定

  • 短距离移动

  • 空间一致性

亮度恒定

对象中任意像素点p(x,y)亮度值,在t-1时候的值,在t时刻移动(u, v)之后亮度值保持不变

空间一致性

假设对像素点p(x, y)来说,周围的像素点都保持相同的移动距离(u, v) 假设窗口大小为5x5,则对于25个窗口内的像素点来说,就会如下等式成立:

得到下面的过约束等式,根据最小二乘可以求解(u, v):

这样我们就得到了KLT光流等式与该窗口的的Hessian矩阵

空间尺度不变性

通过建立每一帧的图像金字塔,实现尺度空间窗口目标对象搜索

OpenCV中KLT演示代码实现

OpenCV中KLT算法API及其参数解释如下:

void cv::calcOpticalFlowPyrLK(
InputArray     prevImg, // 前一帧图像
InputArray     nextImg, // 后一帧图像
InputArray     prevPts, // 前一帧的稀疏光流点
InputOutputArray     nextPts, // 后一帧光流点
OutputArray     status, // 输出状态,1 表示正常该点保留,否则丢弃
OutputArray     err, // 表示错误
Size winSize = Size(21, 21), // 光流法对象窗口大小
int maxLevel = 3, // 金字塔层数,0表示只检测当前图像,不构建金字塔图像
TermCriteria     criteria = TermCriteria(TermCriteria::COUNT+TermCriteria::EPS, 30, 0.01), // 窗口搜索时候停止条件
int flags = 0, // 操作标志
double     minEigThreshold = 1e-4 // 最小特征值响应,低于最小值不做处理
)

特征点检测与绘制的代码实现如下:

// detect first frame and find corners in it
Mat old_frame, old_gray;
capture.read(old_frame);
cvtColor(old_frame, old_gray, COLOR_BGR2GRAY);
goodFeaturesToTrack(old_gray, featurePoints, maxCorners, qualityLevel, minDistance, Mat(), blockSize, useHarrisDetector, k);

特征点绘制

void draw_goodFeatures(Mat &image, vector<Point2f> goodFeatures) {for (size_t t = 0; t < goodFeatures.size(); t++) {circle(image, goodFeatures[t], 2, Scalar(0, 255, 0), 2, 8, 0);}
}

KLT跟踪代码如下

TermCriteria criteria = TermCriteria(TermCriteria::COUNT + TermCriteria::EPS, 30, 0.01);
double derivlambda = 0.5;
int flags = 0;bool ret = capture.read(frame);
if (!ret) break;
imshow("frame", frame);
roi.x = 0;
frame.copyTo(result(roi));
cvtColor(frame, gray, COLOR_BGR2GRAY);// calculate optical flow
calcOpticalFlowPyrLK(old_gray, gray, pts[0], pts[1], status, err, Size(31, 31), 3, criteria, derivlambda, flags);

特征点状态检查与匹配的代码如下

size_t i, k;
for (i = k = 0; i < pts[1].size(); i++)
{// 距离与状态测量double dist = abs(pts[0][i].x - pts[1][i].x) + abs(pts[0][i].y - pts[1][i].y);if (status[i] && dist > 2) {pts[0][k] = pts[0][i];initPoints[k] = initPoints[i];pts[1][k++] = pts[1][i];circle(frame, pts[1][i], 3, Scalar(0, 255, 0), -1, 8);}
}
// resize 有用特征点
pts[1].resize(k);
pts[0].resize(k);
initPoints.resize(k);

绘制跟踪轨迹的代码如下

// 绘制跟踪轨迹
draw_lines(frame, initPoints, pts[1]);

该方法实现如下:

void draw_lines(Mat &image, vector<Point2f> pt1, vector<Point2f> pt2) {if (color_lut.size() < pt1.size()) {for (size_t t = 0; t < pt1.size(); t++) {color_lut.push_back(Scalar(rng.uniform(0, 255), rng.uniform(0, 255), rng.uniform(0, 255)));}}for (size_t t = 0; t < pt1.size(); t++) {line(image, pt1[t], pt2[t], color_lut[t], 2, 8, 0);}
}

运行效果

左侧是视频的原始每一帧、右侧视频是每一帧中KLT算法实时轨迹绘制

下载1:OpenCV-Contrib扩展模块中文版教程

在「小白学视觉」公众号后台回复:扩展模块中文教程即可下载全网第一份OpenCV扩展模块教程中文版,涵盖扩展模块安装、SFM算法、立体视觉、目标跟踪、生物视觉、超分辨率处理等二十多章内容。

下载2:Python视觉实战项目52讲

在「小白学视觉」公众号后台回复:Python视觉实战项目即可下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别等31个视觉实战项目,助力快速学校计算机视觉。

下载3:OpenCV实战项目20讲

在「小白学视觉」公众号后台回复:OpenCV实战项目20讲即可下载含有20个基于OpenCV实现20个实战项目,实现OpenCV学习进阶。

交流群

欢迎加入公众号读者群一起和同行交流,目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群(以后会逐渐细分),请扫描下面微信号加群,备注:”昵称+学校/公司+研究方向“,例如:”张三 + 上海交大 + 视觉SLAM“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告,否则会请出群,谢谢理解~


http://lihuaxi.xjx100.cn/news/280419.html

相关文章

时间序列的建模新思路:清华、李飞飞团队等提出强记忆力E3D-LSTM网络

作者 | Yunbo Wang,、Lu Jiang、 Ming-Hsuan Yang、Li-Jia Li、Mingsheng Long、Li Fei-Fei译者 | 凯隐编辑 | Jane出品 | AI科技大本营&#xff08;ID&#xff1a;rgznai100&#xff09;【导读】如何对时间序列进行时空建模及特征抽取&#xff0c;是RGB视频预测分类&#xff0…

Spring Cloud Consul 之Greenwich版本全攻略

点击上方“方志朋”&#xff0c;选择“置顶或者星标”你的关注意义重大&#xff01;什么是ConsulConsul是HashiCorp公司推出的开源软件&#xff0c;使用GO语言编写&#xff0c;提供了分布式系统的服务注册和发现、配置等功能&#xff0c;这些功能中的每一个都可以根据需要单独使…

html5 原生 弹窗,一起来看 HTML 5.2 中新的原生元素 dialog

不到一个月前&#xff0c;HTML 5.2 正式成为 W3C 的推荐标准(REC),其中&#xff0c;推出了一个新的原生模态对话框元素 &#xff0c;乍一看&#xff0c;可能感觉它就是一个新增的元素&#xff0c;然而&#xff0c;作者最近在玩的时候&#xff0c;发现它确实是一个值得期待和很有…

【原创】StreamInsight查询系列(六)——基本查询操作之分组聚合

上篇博文介绍了StreamInsight基础查询操作中的用户自定义聚合部分。这篇文章将主要介绍如何在StreamInsight查询中使用分组聚合。 测试数据准备 为了方便测试查询&#xff0c;我们首先准备一个静态的测试数据源&#xff1a;var weatherData new[] {new { Timestamp new DateT…

双目视觉摄像机的参数标定参考坐标系介绍

点击上方“小白学视觉”&#xff0c;选择加"星标"或“置顶”重磅干货&#xff0c;第一时间送达本文转自 | 新机器视觉焊接机器人视觉的基本任务就是从双目摄像机获得的二维图像中恢复物体的三维空间信息&#xff0c;从而能够识别目标物体&#xff0c;进行生产作业。空…

雷军,扎克伯格,Linus 等巨佬的办公桌

点击上方“视学算法”&#xff0c;星标公众号重磅干货&#xff0c;第一时间送达大多数同为工程师的读者们&#xff0c;应该总是会对“工程师的办公桌到底有多乱”这类话题感兴趣&#xff0c;那些曾经的工程师、程序员巨佬的办公桌是否也杂乱无章呢&#xff1f;来看看。1、雷军2…

简单介绍VBS批量重命名文件并且操作前备份原有文件

这篇文章主要介绍了VBS批量重命名文件并且操作前备份原有文件,需要的朋友可以参考下 核心函数 VBScript Source File -- Created with SAPIEN Technologies PrimalScript 4.0NAME: AUTHOR: Microsoft , MicrosoftDATE : 2014/7/9COMMENT: 批量修改文件夹下对应的所有文件名选择…

为什么华为200万招聘AI博士,马斯克却推出脑机接口对抗AI?

作者 | 伍杏玲来源 | CSDN&#xff08;ID&#xff1a;CSDNnews&#xff09;7 月&#xff0c;华为一则薪资通知刷爆朋友圈&#xff1a;华为给8位博士应届生给予 89.6 万至 201 万的年薪。其中薪资最高的两位博士均研究人工智能相关专业。7 月还有一件大事&#xff1a;马斯克发布…