一种基于视频帧差异视频卡顿检测方案

点击上方蓝字关注我们!

背景

在视频质量检测中,检测视频是否卡顿也属于视频质量检测的标准之一,在构建视频检测平台中,这一步至关重要。

本文要说明的是把视频转换为帧序列,根据计算帧之间的差值,寻找帧序列中是否有断层,来判断当前视频是否存在卡顿的现象。

结果为一个数据, 0 代表无卡顿现象, 1代表存在卡顿现象

技术与架构

用户上传视频文件后,使用ffmpeg 转换为图片序列,抽取图片信息,计算所有序列帧的图片运动像素,计算所有序列图片的平均运动水平,动态计算动态因子,输出判断结果, 0表示当前不存在卡顿点, 1表示当前存在卡顿点。

整体方案主要分为六个部分

  1. 图片处理

  2. 图像相邻帧像素计算

  3. 计算所有图片运动量,组合为运动集合

  4. 消除视频图片场景剪辑比例,计算平均运动量

  5. 计算动态因子

  6. 返回结果

** 技术优势:**

不需要准备大量的数据集来训练模型,只针对当前要处理的视频进行计算;

不会因为大量的动态场景和静态场景影响卡顿检测的结果;

精准高效,计算量相对较低

技术实现

1、图片处理

这里采用灰度图片来作为视频卡顿检测的输入序列图片数据,重新设置当前图片的大小为 360*640,当前区域为我们后面计算的兴趣区域.设定兴趣区域,可以有效的避免一些像素点计算的噪声影响。

2、图像相邻帧计算

A.遍历当前图像集,使用t+1(下一时刻帧) 的像素减去t(当前时刻帧)的像素值,计算出两帧之间的差异信息。

B.设定阈值,这里的阈值是一个常量值 = 30,当两帧之间的差异值> 30的时候,就任务图片存在运动像素,否则,没有存在运动,值为 0,此步骤消除了低运动噪声,或感知能力下的运动像素。

3、计算所有图片的运动量

将步骤2中的值进行平方,将幅度转换为能量,并计算每个视频帧的平均值.该平均值就是当前帧的能量值,所有帧的动量值记为TI2。

4、消除视频图片场景切换比例,计算平均运动水量

A.在计算平均值之前要消除场景剪辑比例,这里使用的常量值为 0.02,就是说我们有100个帧要消除2个场景的剪辑。

B.对 TI2 从小到大排序,在这个序列中,根据B中的比例值,消除最高和最低的两个噪声值,循环遍历TI2,计算t时刻帧之前所有帧的平均值,并把这个平均值进行累加.当场景切换的时候,TI2 序列的低点和高点均被消除,平均TI2值(TI2_AVG)不会收到影响。

5、计算动态因子

在近乎静态的场景和动态的场景中,由于像素的变动很小,或者像素变动很大,卡顿的帧/丢失帧会存在少量/大量的运动信息,在确定运动水平的时候需要涉及主观直觉的要素,所以需要利用动态阈值来确定卡顿的视频帧。

在视频中,存在的动态场景较多,该阈值增加,静态场景,阈值减少。

Dfact = a + b * log(TI2_AVG) a ,b, c 都为常量,分别为 2.5, 1.25, 0.1,c为限制Dfact 较小的一个值。

当 Dfact < c = Dfact else 等于 c, Dfact 取值范围是[0, 0.1]之前的一个值。

帧的丢弃和运动量是线性依赖于平均运动能量的对数。

6、返回结果

循环遍历视频帧,获取每一帧的TI2值,如果当前的TI2值<= Dfact * Mdrop,认为当前的帧是卡顿的,也就是值为1,如果当前的TI2值> Dfact * Mdrop, 任务当前帧不存在卡顿,把视频所有的帧按找时间顺序排序后,就是我们当前视频卡顿检测的列表值。

Dfact 为上述计算的动态因子,Mdrop为固定运动能量阈值来确定帧的卡顿.Mdrop 为常量值 0.015。

效果展示