视频格式全解析

视频格式是指用于存储、传输和播放视频数据的标准化规范,包含编码格式​(压缩算法)和容器格式​(封装方式)两大部分。其核心目的是在保证画质的前提下,通过压缩技术减少文件体积,并适配不同设备和场景的播放需求。

​容器格式(Container)

  • MKV:Matroska Video,开放标准的多媒体容器格式,由俄罗斯开发者Steve Lhomme于2002年提出。它并非视频编码格式,而是通过“容器”形式将多种编码的视频、音频、字幕等数据封装到单一文件中。

  • WMV(Windows Media Video):微软公司开发的视频编解码技术,属于Windows媒体框架的核心组件

  • AVI(Audio Video Interleaved):微软于1992年推出的多媒体容器格式,采用RIFF(资源交换文件格式)结构,将音频和视频数据交错存储以实现同步播放。

  • MPEG1 System(Moving Picture Experts Group):MPEG-1标准的核心组成部分,负责将压缩后的视频、音频及辅助数据进行多路复用和同步控制,确保音视频数据在播放时保持时间一致性。

  • MPEG1 Video CD:基于MPEG-1编码标准的光盘存储格式,诞生于1993年,由飞利浦、索尼等公司联合推广。它利用MPEG-1压缩技术将视频和音频数据存储于CD光盘中,实现了家庭影音数字化,成为20世纪90年代至21世纪初主流的视频传播媒介.

  • MPEG2 VOB(Video Object)​:MPEG-2​是国际通用的视频压缩标准,支持高清分辨率和多声道音频编码,​VOB​是DVD专用的多媒体容器格式,基于MPEG-2标准封装视频、音频、字幕及导航数据

  • MPEG2 SVCD(Super Video CD):​VCD的升级版,由中国主导研发并于1998年成为国家标准。它基于MPEG-2编码技术,旨在提供比VCD更高的画质和功能,同时避免依赖DVD的专利技术。

  • MPEG2 DVD:数字多功能光盘(Digital Versatile Disc)的核心技术组合,通过MPEG-2编码标准实现视频压缩与存储,结合VOB(Video Object)容器格式管理音视频数据。MPEG-2为DVD提供广播级画质(最高720×576分辨率)和高效压缩能力,支持动态码率(3-15 Mbps),同时兼容多声道音频与交互功能。

  • MPEG2 TS(Transport Stream):基于MPEG-2标准的容器格式,专为数字电视广播和不可靠传输介质​(如卫星、地面信号)设计。

  • MPEG4 MP4:​MPEG-4是国际标准化组织(ISO/IEC)制定的多媒体压缩标准,涵盖音视频编码、交互式媒体、数字版权管理(DRM)等综合功能。其核心目标是实现高效压缩与内容交互性,支持从低带宽通信到高清视频的广泛场景。​MP4​(MPEG-4 Part 14)则是MPEG-4标准中定义的容器格式,负责封装视频、音频、字幕等数据流,并管理多媒体的同步与复用。简言之,MPEG-4是技术标准,而MP4是该标准下的一种文件存储与传输形式。

  • MPEG4 MOV(QuickTime Movie):苹果公司开发的容器格式,最初用于QuickTime播放器,支持封装视频、音频、文本、图像等多媒体数据。

  • MPEG4 3GP1:为移动通信设备设计的简化版MP4容器,专为低带宽、小存储的移动设备优化。

  • MPEG4 3GP2:核心目标是为CDMA网络(如CDMA2000)提供低带宽、高兼容性的音视频传输方案。

  • MPEG4 PSP:索尼PlayStation Portable(PSP)掌机支持的基于MPEG-4标准的视频格式,主要包含普通MP4和MP4-AVC两种规格 。其核心目标是适配PSP硬件性能与屏幕分辨率(480×272),同时通过高效压缩实现视频内容的便携播放。

  • MPEG4 IPOD:便携设备的高效视频播放。

  • MPEG4 Fragment:MPEG-4标准(ISO/IEC 14496-12)中定义的流式容器格式,专为动态传输和自适应流媒体设计。其核心特性在于将媒体数据分割为多个独立的片段(Fragment)​,每个片段包含元数据(moof)和媒体数据(mdat),从而实现高效的分发与灵活播放。

  • OGV(Ogg Video):基于Ogg容器的开源视频文件格式,由Xiph.Org基金会开发,旨在提供免专利限制、高质量的多媒体解决方案。

  • Flash FLV:Adobe Systems开发的流媒体视频容器格式,专为网络传输设计,早期与Macromedia Flash Player深度绑定。

  • Flash SWF(Shock Wave Flash):矢量动画格式

  • DPG(Nintendo):由日本开发者moonlight为任天堂NDS掌机设计的非官方视频格式,需配合Moonshell等软件播放。

  • WebM:由 Google 主导开发的开源视频容器格式,旨在为网络提供高质量、免版税的视频压缩方案。

  • Real Media:由 RealNetworks 公司于 20 世纪 90 年代开发的流媒体容器格式,主要服务于早期互联网环境下的音视频传输。

  • WTV(Windows Recorded TV Show):微软为 ​Windows Media Center​ 开发的 ​电视录制容器格式,主要用于存储电视节目内容,包含音视频流、元数据及数字版权管理(DRM)信息。

  • MXF(素材交换格式):由 ​SMPTE(美国电影与电视工程师学会)​​ 主导开发的专业音视频容器格式,旨在解决影视制作、存储和交换中的兼容性问题。

  • WEBP:由 Google 于 2010 年推出的开源图像格式,旨在通过更高效的压缩算法减少网络传输中的图片体积,同时保持视觉质量。

  • GIF(Graphics Interchange Format,图形交换格式):由 ​CompuServe 公司于 1987 年开发的位图图像格式,旨在解决早期互联网环境下跨平台图像交换的需求。

  • Raw(原始图像格式):数码相机、扫描仪等设备直接记录的未经处理的传感器数据,保留了拍摄场景的完整光学信息。

编码格式

  • MPEG-1(1992年):首个国际标准,用于VCD制作,支持352×240@30fps分辨率,码率1.5 Mbps,采用YCbCr 4:2:0采样和DCT压缩。

  • MPEG-2(1994年):提升至高清支持(1920×1080),码率3-10 Mbps,应用于DVD和数字电视广播,支持隔行扫描和5.1声道音频。

  • MPEG-4(1998年):引入基于对象的编码技术,支持流媒体和交互式内容,压缩效率比MPEG-2提升30%以上,扩展了H.264(MPEG-4 Part 10)标准。

  • H.264(AVC)(2003年):采用运动补偿、DCT变换和CABAC熵编码,压缩效率比MPEG-2提升50%,支持蓝光、视频会议和流媒体,兼容性极广。

  • H.265 (HEVC)(2013年):引入更精细的块划分(最大64×64)、多角度预测和并行处理,压缩效率比H.264高40%-50%,适配4K/8K视频,但专利费用较高。

  • H.266 (VVC) (2020年):支持360°全景视频和动态分辨率切换,压缩效率比HEVC再提升40%-50%,但解码复杂度大幅增加。

视频码率

视频码率(Bitrate)指单位时间内传输的视频数据量,单位为 ​kbps(千比特每秒)​,表示每秒传输的二进制位数。码率越高,视频数据的“取样率”越高,画质越接近原始素材,但文件体积也会随之增大。

音频编码

音频编码是将声音的模拟信号转换为数字信号的过程,核心目标是通过压缩减少数据冗余,同时尽可能保留听觉质量。

  • AAC:优化频率划分和预测算法,相同码率下音质优于MP3,流媒体首选。
  • ALAC:苹果设备专用,兼容性与FLAC相当。
  • FLAC:开源无损格式,压缩率约50%,适合音乐存档。
  • Opus:开源、免专利费的现代音频编码格式,由国际互联网工程任务组(IETF)标准化,专为满足从语音通话到高保真音乐流媒体的多样化需求设计。
  • PCM(脉冲编码调制):未经压缩的原始音频格式,直接记录模拟信号的采样值,属于无损编码。

比特率控制

  • CBR(恒定比特率):全程保持固定码率,通过调整量化参数(如压缩强度)维持稳定传输。
  • VBR(可变比特率):根据内容复杂度动态调整码率,高动态画面分配更高码率,静态场景降低码率。
Licensed under CC BY-NC-SA 4.0