`
rcfalcon
  • 浏览: 221839 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

视频帧对齐算法

 
阅读更多



对于两段视频,可能内容源相同,但采集的开始时间不一,或视频格式有所差别,或采集中信号传输的损坏率有所差别。

在这种情况下,如何将它俩基于视频帧对齐,找到一个共同的基准点,是一个值的研究的问题。


本文针对这种问题,提供一种技术解决思路,并笔者已经验证可行:


1、将视频分别标记为A、B

2、从B视频中间提取一段,全部解出帧图像组x

3、将A所有帧均解出图像组y

4、将x、y每一帧量化成一个向量(这里笔者用的48维色度),用于图像相似度判断。具体实现方式请查阅图形学相关论文。

5、x形成的向量组上取N个突变点(相邻两帧差距最大,帧的差距使用向量的模来衡量)

6、在y上形成基于N个突变点的滑动窗口,计算N个点的差距,取最小滑动位置

7、该位置即对齐点


有点抽象,相关代码出于保密考虑,不在此展示了。

本文没讨论解决的问题:

1)A、B帧率不同(但在本文基础上很好修改,只要将向量取模考虑成综合帧距类似取“积分”的形式即可)

2)算法优化(在A上可以不取全部帧,一般业务上都是可以预估对齐范围的)



分享到:
评论

相关推荐

    一种新的视频质量评价中帧对齐算法 (2012年)

    提出了一种新的帧对齐算法,该方法在国际电信联盟(ITU)的ITU-T J.244和J.247的基础上,对源视频和劣化视频序列进行预处理和相关特征参数的提取,并采用类似滑动窗口的原理对二者进行相似度的运算,根据运算结果可...

    论文研究 - 通过可识别订单的示例和对齐方式进行类似的视频检索

    在本文中,我们介绍了用于类似视频检索的机器学习算法和系统。 在这里,查询本身就是视频。 对于相似性测量,通过无监督学习来提取每个视频中的样本或代表性帧。 对于此学习,我们选择了有订单意识的竞争性学习。 在...

    光流法实现计算机视觉的图像实时拼接

    本算法采用光流法算法,实现计算机视觉的图像实时拼接

    drifty_shifty_delux​e.m:图像或视频帧的自动空间漂移校正。-matlab开发

    此脚本使用互相关算法校正视频数据帧之间的空间漂移。 它可以将视频数据作为输入,然后输出一个视频文件,每个图像帧中的特征对齐。 一份使用说明书已提交给 Microscopy Today,并有望在不久的将来出版。

    基于SIFT特征匹配的运动目标检测及跟踪方法

    在目标检测阶段,首先提取两帧带检测图像的SIFT特征点并进行特征匹配,然后计算两帧图像之间的几何变换矩阵,从而实现图像的几何对齐。再将几何对齐后的两幅图像进行差分,并在差分图像中寻找SAD最大值区域作为运动...

    foreground-segmentation:Pytorch代码“使用深度残差网络的监视视频中的异常检测的前景分割”(SBRT 2017)

    输出分割图具有与输入视频帧相同的分辨率。数据集光盘网对于我们的实验,我们使用数据库。 一个用于识别摄像机视野中变化或移动区域的数据库,涵盖了广泛的检测挑战,并代表了当今在监视中捕获的典型室内和室外视觉...

    LGFN

    输出整合在一起并发送到重建模块中,以恢复高分辨率视频帧。 依存关系 Python 3.6 PyTorch = 1.0.1 可变形卷积-> 数据集 (提取的代码:“ hjle”) (提取代码:“ htvb”) (提取代码:“ ouyg”) 预训练...

    Image-Alignment-Algorithms.rar_ image alignment_Image Alignment_

    图像对其算法.这个程序需要对齐模板(小蝴蝶图像)的大图像(花上的蝴蝶)。它不限于使用一只蝴蝶作为模板。例如,您可以使用人脸图像作为模板,确定在脸上的视频序列中的下一帧的动作。

    通过在线学习混合模板进行自适应对象跟踪

    通过在视频中在线学习混合对象模板,提出了一种自适应跟踪算法。 模板由多种类型的特征组成,每种特征都描述一种特定的外观结构,例如平面度,纹理或边缘/拐角。 我们提出的解决方案包括三个方面。 首先,为了使不同...

    3d_scene_reconstruction_from_video:使用OpenCV在C ++和Matlab中从视频进行3d场景重建

    设计了一种算法,可以改善长帧序列中特征的跟踪; 通过对极约束计算摄像机在每两帧之间的旋转和平移,并创造性地解决了由符号引起的解决方案的歧义; 通过使用小基线图像迭代地完善特征深度的估计,并在Matlab中...

    MATLAB典型环节代码-cvpr18_multimodal_weakly_supervised_learning:CVPR2018论文“具有

    我们还要感谢Laptev博士和Bojanowski博士为脚本字幕对齐实现了动态时间规整算法。 此代码在外部存储库中发布。 我们还提供了使用预先计算的动作功能的弱监督动作识别系统。 代码 面部管道(MATLAB): 该代码基于[2]...

    在Grassmann流形上学习比赛核以进行动作识别

    子空间是在语义视频剪辑中的帧上临时存储的一组卷积神经网络(CNN)特征向量,可同时捕获局部判别模式和运动的时间动态。 为了测量动作之间的相似性,我们基于线性子空间的典型相关性提出了格拉斯曼匹配核(GMK),...

    delphi 开发经验技巧宝典源码

    0254 使窗体标题栏文字右对齐 170 0255 在窗体标题栏上添加按钮 171 0256 取消窗体标题栏的关闭按钮 172 0257 如何实现闪动的标题栏文字 172 0258 怎样动态修改窗体图标 172 8.2 窗体的动态显示 173 ...

    delphi 开发经验技巧宝典源码06

    0254 使窗体标题栏文字右对齐 170 0255 在窗体标题栏上添加按钮 171 0256 取消窗体标题栏的关闭按钮 172 0257 如何实现闪动的标题栏文字 172 0258 怎样动态修改窗体图标 172 8.2 窗体的动态显示 173 ...

Global site tag (gtag.js) - Google Analytics