视讯业务中视频编码技术实现
人们可以非常方便的利用即时通信软件进行视频聊天,登录互联网可以访问大量的视频网站,通过网站,用户可以在线观看新闻、电影、电视剧等视频信息资源。公司之间可以随时召开视频会议,采用视频监控系统进行安防、安全生产监控等工作。
一、前言
随着数字多媒体广播、3G和宽带互联网技术的迅猛发展,视讯业务得到空前的发展和壮大,几乎达到无处不在的地步。人们可以非常方便的利用即时通信软件进行视频聊天,登录互联网可以访问大量的视频网站,通过网站,用户可以在线观看新闻、电影、电视剧等视频信息资源。公司之间可以随时召开视频会议,采用视频监控系统进行安防、安全生产监控等工作。在视讯业务发展过程中存在以下几个关键技术:
1.视讯业务的框架协议
在视频通信、视频监控、视频会议等实时应用中,建立通信需要一系列的通信协议来支持,例如:呼叫控制协议、视音频数据传输协议、云台控制、录像控制、会议控制协议等。在互联网的多媒体视讯业务中,目前有一些组织正在研究一种基于P2P平台上的全新的流媒体播放技术,充分利用P2P网络的优势,基于多点下载技术保证视频完整而流畅的播放。
2.视频编解码技术
在数字传输通道中传输视频信息或者采用数字信号对视频信息进行存储,原始视频信息量非常庞大,在保证图像质量和传输带宽(或者存储空间)的平衡中,采用数字信号处理技术尽可能降低视频编码比特率。经过多年技术研究,在视讯业务中产生了数量众多的视频编解码技术,不同的视频编解码适用于不同的视讯业务,可根据视讯业务对图像质量、实时性等需求采用不同的编解码技术。
3.视频业务的服务质量保证
服务质量保证(QoS)是IP网络承载视讯业务的关键,在召开视频通信、视频会议的过程中,图像是否连贯;在视频监控应用中,图像是否清晰、是否满足安防的需要;在IPTV应用中,图像实时性要求并不高,但是图像质量是否满足娱乐的要求;在互联网视频在线应用中,图像是否连贯、清晰等。这些都需要在IP网络上根据不同的视讯应用采用不同等级的服务质量保证措施。目前广泛采用优先级标记、队列调度、DiffServ(业务区分)以及MPLS技术等来保证服务质量。
随着视讯业务相关协议和视频编解码技术的日趋完善,随着智能多媒体终端的普及,各种视讯业务应用逐渐成熟,逐渐融入到人们生活的各个角落中。
二、视频编解码技术介绍
为了提高视频信号的信噪比、抗干扰能力,便于存储、处理和交换,需要对模拟视频信号进行数字化处理。视频信号的数字化需要进行采样、量化和编码过程。
经过数字化处理的视频信号,在传输过程中需要占用大量的带宽,为了减小数字视频信号的存储空间或降低传输带宽,运用数字信号处理技术,降低视频信号的比特率,称为视频压缩编码技术。相应编码的逆变换,称为解压缩或解码。
视频编解码通过减少视频信号的冗余信息达到压缩数据量,视频信号的冗余度主要体现在空间相关性(帧内)、时间相关性(帧间)和色度空间表示上的相关性。视频编码有许多种,从不同的角度出发有不同的分类方法,比如从信息量的角度出发可分为两大类:
1.有损压缩
解码图像和原始图像是有差别的,允许有一定的失真。主要使用的算法有:运动补偿、DCT(Discrete Cosine Transform)、子带编码、统计分块编码、矢量量化、分形编码、模型基编码等。
2.无损压缩
解码图像和编码前的图像严格相同,没有失真。主要使用的算法有:哈夫曼编码、算术编码、行程编码等。
目前应用于视频通信、视频会议、视频监控、IPTV、视频广播等领域的编解码基本上都是有损压缩编码。下面本文对相关视频编解码做一个简要介绍。
制定视频编码标准的正式组织有两大组织:ITU-T与国际标准化组织和国际电工委员会(ISO/IEC)。ITU-T的标准称之为建议,并命名为H.26x系列,包括H.261、H.263、H.264,主要应用于实时视频通信领域,如可视电话、会议电视等。ISO/IEC制定的标准主要是MPEG(Moving Picture Exports Group)系列标准,主要应用于视频存储、视频广播和视频流媒体、因特网或无线网上的流媒体等。一般情况下,这两个组织独立制定相关标准。两个组织也共同制定了一些标准,H.262标准等同于MPEG-2的视频编码标准。1997年,ITU-T的VCEG与ISO/IEC 的MPEG成立了JVT (Joint Video Team ), 2003年3月由JVT公布了H.264视频编码标准,ITU将该系统命名为H.264/AVC,ISO/IEC将其称为14496-10/MPEG-4 AVC。H.264标准被纳入MPEG-4的第10部分。视频编码标准的演进如图1所示。

图1 视频编码标准发展
1、H.26X视频编码标准
H.261是最早的运动图像编码标准,该标准由CCITT于1988至1990间发展制定,主要应用于ISDN上开展可视电话、视频会议。H.261标准的比特率为64kbit/s的整数倍。H.261图像格式为CIF和QCIF两种格式,采用两种帧编码类型:帧内编码(I-frames)和帧间编码(P-frames)。H.263是最早用于低码率视频编码标准,由ITU-T于1996年为低于64kb/s的窄带通信信道制定的视频编码标准。主要用于IP网络上开展视频会议、可视电话。它是在H.261基础上发展起来的。H.263与H.261相比采用了半像素的运动补偿,并增加了4种有效的压缩编码模式。H.263+视频编码标准是H.263标准的版本2,H.263+标准允许更大范围的图像输入格式,自定义图像的尺寸,从而拓宽了标准使用的范围,使之可以处理基于视窗的计算机图像、更高帧频的图像序列及宽屏图像。H263++在H263+基础上增加了3个选项,主要是为了增强码流在恶劣信道上的抗误码性能,同时为了提高增强编码效率。H.264/AVC的编解码框架与以前提出的标准,如H.261、H.263并无显著变化。在相同的图像质量的情况下,H.264比H.263减小50%比特率。H.264对网络传输具有更好的支持功能,它引入了面向IP包的编码机制,有利于网络中的分组传输,支持网络中视频的流媒体传输。H.264具有较强的抗误码特性,可适应丢包率高、干扰严重的无线信道中的视频传输。对信道时延的适应性较强,既可工作于低时延模式以满足实时业务,如会议电视等,又可工作于无时延限制的场合,如视频存储等。采用采用复杂度可分级设计,在图像质量和编码处理之间可分级,以适应不同复杂度的应用。H.264的算法复杂度也比较高,编码复杂性是H.263的三倍、解码复杂性是H.263的两倍。
2、 MPEG系列视频编码标准
MPEG于1988年成立,是为数字视音频制定压缩标准的专家组。目前已提出MPEG-1,MPEG-2,MPEG-4等一系列标准。MPEG-1标准于1993年8月公布,用于传输1.5Mbit/s数据传输率的数字存储媒体运动图像及其伴音的编码。于1994年推出MPEG-2压缩标准,以实现视音频服务与应用互操作的可能性。MPEG-2标准是针对标准数字电视和高清晰度电视在各种应用下的压缩方案和系统层的详细规定,特别适用于广播级的数字电视的编码和传送,被认定为SDTV和HDTV的编码标准。于1999年正式公布了MPEG-4标准与MPEG-1和MPEG-2有很大的不同,MPEG-4不只是具体压缩算法,它是针对数字电视、交互式绘图应用、交互式多媒体等整合及压缩技术的需求而制定的国际标准。MPEG-4标准将众多的多媒体应用集成于一个完整的框架内,旨在为多媒体通信及应用环境提供标准的算法及工具。MPEG-4 AVC 更加适合低带宽传输。在高码率上,AVC 的表现也要好过 MPEG-4,下一代 HD DVD 和 Blue Ray Disc 已经正式接纳 AVC 为视频编码方案之一。 MPEG-7是多媒体内容描述接口,对MPEG-1、MPEG-2、MPEG-4起到了性能提高和功能扩展的作用,但是不能替代这些标准,只是这些标准的补充。
除上述两大组织提出的视频编解码标准之外,还有一些非常流行的视频编解码编解码标准,例如:Windows Media系列、AVS等标准,下面本文也进行一些简要的介绍。
3、FLV
随着Web 2.0时代的到来,视频网站,如酷6网、土豆网、优酷网、56.com等一大批网站如雨后春笋般出现在互联网中。这些网站提供视频在线播放、上传、下载等多种互联网服务。同时提供视频新闻、短片、电影等极大丰富的视频内容。这类网站在线播放技术中都无一例外的使用了Flash播放载体,称为 Flash 视频 (FLV) 。FLV 是FLASH VIDEO的简称,FLV流媒体格式是一种新的视频格式。它将视频整合到Flash 动画中。采用标准的flash播放插件就能观看flash动画和flv格式的视频信息。也就是说,网站的访问者只要能看Flash动画,自然也能看FLV 格式视频,而无需再额外安装其它视频插件,FLV视频的使用给视频传播带来了极大便利。采用FLV格式形成的视频信息文件极小、加载速度极快,使网络在线观看者可以几乎不用等待下载时间而顺畅观看相关视频。通常, Flash视频文件包含的视频比特流,是变异的H.263视频标准,也有on2 vp6和 H.264视频标准。
4、AVS
AVS 标准是《信息技术 先进音视频编码》系列标准的简称,是我国具备自主知识产权的数字音视频编解码技术标准。AVS从严格意义上讲不仅是视音频编解码标准,AVS标准包括系统、视频、音频、数字版权管理等四个主要技术标准和一致性测试等支撑标准。它的编码效率与竞争性国际标准MPEG-4/H.264相当,代表了国际先进水平,广泛应用于广播、通信、电视、IPTV、娱乐等各个领域。
本文下面介绍3GP、FLV标准格式,3GP、FLV不能完全算视频编解码技术,它是一种流媒体的格式,适合互联网或者移动网传输,但是在现实应用中实在太广了,本文也进行一下简单介绍。
5、Windows Media 系列
Windows Media系列编解码是由微软公司主导的音频视频编码系列,早在1992年年微软就在Windows 3.1操作系统中捆绑了Windows Media Player1.0,在Windows98操作系统中捆绑了Windows Media Player6.4,目前Windows Media Player的版本已经升级到Windows Media Player12。Windows Media Player12不但在界面、分类管理、网络共享等等功能进行了改进,而且对高清视频提供了较好的支持,WMP12能够正常播放MPEG2、MPEG4、H.264等编码在内的多种高清视频, 画面效果清晰流畅。凭借微软的雄厚技术实力和功能日趋丰富,Windows Media Player12已经发展成为一个全能的网络多媒体播放器。Windows Media Player可以播放WMV、MPEG系列、AVI等视频文件。
WMV是微软推出的一种流媒体格式,它的出现主要是为了进行网络视频传输,现在已经向 HDTV 方面进军,开发了 WMV HD 应用。在同等视频质量下,WMV格式的体积非常小,因此很适合在网上播放和传输。MMV v1/v2/v3是基于 MPEG-4 技术开发。从WMV7开始脱离了 MPEG-4,和 MPEG-4 不兼容,开始使用微软自己非标准MPEG-4Part2。这个版本在压缩速度上非常快,但是图像效果一般。WMV9和以前版本相比进步非常多。特别是 WMV HD 的应用,WMV-HD是基于WMV9标准,是微软开发的视频压缩技术系列中的其中一个版本,在性能上 压缩率高于MPEG2标准,基本可以达到MPEG2的一倍,与H.264压缩率相当。
6、3GP
3GP是由3GPP组织针对移动终端手机规定的一种视频编解码格式,3GP编解码基于 MPEG4,是MPEG4的一种简化版本,减少了储存空间和较低的频宽需求,语音部分基于AMR-NB or AAC-LC编解码。为了在移动设备的显示屏幕上正常播放,3GP定义图像尺寸和传输带宽。3gpp标准制定是针对GSM手机,扩展名为.3gp。3GPP2标准制定是针对CDMA手机,扩展名为.3g2。3GPP和3GPP2标准视频编解码都支持MPEG4和H.263,音频编解码都支持AAC和AMC。3GP标准的优点是压缩的视频信息量少,移动性强,适合移动设备使用。
三、结束语
从上述分析中可以看出除了象微软、RealNetworks这类公司开发自己的视音频编解码,其他很多编解码和流媒体技术都是采用ITU-T与(ISO/IEC)的H.26x系列和MPEG系列或者稍作修改。H.26x和MPEG系列标准算是视频编解码领域中重中之重的标准了。目前H.264和MPEG4标准不断的发展,高清视频、移动视频、在线视频可能成为将来编解码技术关注的问题。