登陆注册
3190000000014

第14章 素材(4)

3.3.3.2根据SMPTE的DV专业压缩

SMPTE标准306M和314M定义了DV编码视频和音频的内容、格式、视频记录方法和相关音频以及辅助信息的记录。SMPTE 306M只处理25Mb/s的视频,而314M则处理25Mb/s 4∶1∶1的视频和50Mb/s 4∶2∶2的视频。

该标准定义了1个视频信道和2个独立的音频信道,能够对25Mb/s的DV进行独立编辑,也为50Mb/s的DV定义了1个视频信道和4个独立的音频信道。该标准还同时考虑了2种电视制式NTSC制(525线480动态线,每秒29.97帧)和PAL制(625线576动态线,每秒25帧)。

SMPTE 306M考虑了存取素材在盒式6.35毫米磁带上。该记录使用了螺旋轨道,每个轨道包含原始轨道信息(Intial Track Information, ITI)(包括开始同步信息和轨道信息)、音频部分和次级编码部分(包括时间控制码数据和一些可选数据)。帧的记录具体化为NTSC制10轨道,PAL制12轨道。

音频部分由音频前同步码、音频同步块和音频后同步码(除了实际的音频数据、音频辅助数据、纠错部分和检测信息以外)组成。实际音频数据是音频同步块的一部分。和音频相似,视频部分也有视频前同步码、视频同步块及视频后同步码。视频同步块由149个数据同步块组成。

对于音频编码来说,该标准具体化了包含72个字节音频数据的数据包。每2个(或4个)音频信道完全一致,但是可以独立工作。音频输入信号以48kHz、16比特量化而抽样,并与视频信号锁定。音频信号以NTSC制每帧1602(或1600)的抽样率和PAL制每帧1920的抽样率被处理。音频帧的延续时间和相应的视频帧的延续时间相同。对基于内部和外部的奇偶性错误检测和改正操作也进行了定义。

该标准的视频编码部分区别了4∶2∶2抽样的50Mb/s的DV视频和4∶1∶1抽样的25Mb/s的DV视频。编码过程开始于输入的模拟视频信号,该信号以13.5MHz的亮度信号和6.75MHz的色度信号抽样(在4∶2∶2抽样的情况下)。对于DV25,所有每行的720个亮度像素被处理,但是另外的360个色度像素却被抛弃,因此是将4∶2∶2抽样信号过滤成4∶1∶1的抽样信号。对于DV50则始终保持4∶2∶2的抽样信号。

接下来的抽样应用了DCT。对于DV25,应用1个宏块中的4个亮度信号的DCT块,2个色度信号的DCT块。而DV50使用1个宏块中的2个亮度信号的块和2个色度信号的块。对于NTSC制的DV50每帧有2 700个宏块,DV25每帧有1 350个宏块。而PAL制的DV50每帧有3 240个宏块,DV25每帧有1 620个宏块。

抽样和DCT之后,DCT的协同加权系数被量化成为9比特字节并区分了量化步骤。所谓的视频片段由5个被压缩的宏块组成。然后一个视频片断又被压缩成为385字节的数据流。在压缩过程中,应用了熵编码和各种游程编码。

为了DV25编码视频的转换,为NTSC制定义了每帧10DIF的序列,为PAL制定义了每帧12DIF的序列。而DV50则采用2个每帧10(或12)DIF序列的信道同时转换。

3.3.4内容管理系统中的视频格式

在内容管理系统中,要管理很多不同的视频格式,其中大部分将是基于DV或者MPEG标准编码的数字化格式。然而应该注意的是,目前视频制作和处理中仍有很多模拟或者基于磁带的格式在使用。尽管这些格式不能在无磁带的工作流中使用,但是它们仍应该得到管理。目前的视频记录格式包括:

·模拟组件格式,如BETACAM、BETACAM SP和M-2。

·D-2、D-3数字复合格式。

·数字BETACAM数字组件格式(用本地数据率约为90Mb/s的压缩格式)。

·D-5数字组件格式,根据数字演播室标准ITU-R BT 601-5透明记录10比特数字视频(不使用视频压缩)。

新的数字视频磁带记录格式通常基于DV或MPEG-2标准的压缩算法。已有的应用如下:

·数字组件格式DVCPRO(使用4∶1∶1抽样和基于DV视频压缩标准,网络数据率为25Mb/s)。

·数字组件格式BETACAM SX(使用4∶2∶2抽样和MPEG-2,IB帧视频压缩方案,网络数据率为21Mb/s)。

·数字组件格式D-9(Digital S)(使用4∶2∶2抽样和基于DV视频压缩标准,网络数据率为50Mb/s)。

·数字组件格式DVCPRO50(使用4∶2∶2抽样和基于DV视频压缩标准,网络数据率为50Mb/s,和D-9格式一样)。

·数字组件格式DVCAM(使用4∶2∶0抽样和家庭DV视频压缩标准,网络数据率为25Mb/s)。

·数字组件格式D-10(MPEG IMXTX)(使用4∶2∶2抽样和基于MPEG-2 4∶2∶2 P@ML、I帧视频压缩标准,网络数据率为50Mb/s)。

为了明确内容管理系统中视频的需求,需要考虑在具体系统中实际应用的格式。大体来说,不同的格式可以达到不同的目的,如低比特率浏览格式是用来预览材料的。然而,浏览的应用越复杂,用户对浏览的要求就越高。目前认为,双声道音频已经够用了,但是在多种语言的节目中需要很多不同语言的音轨,因此这些类型的格式要支持目前和将来所需的特性。

数字广播格式的比特率可以根据转换信道的不同而变化,通常是4~8Mb/s。这些格式目前都是基于MPEG-2标准的。在制作中很多格式支持不同的带宽和质量水平,所以选择何种格式取决于制作者的需要和制作环境。大体来说,这些格式的带宽从新闻制作的18Mb/s到特征特写的50Mb/s变化。内容管理系统要合理处理这些格式并且提供尽可能快速和更好的访问方式。从质量角度来说,无压缩(或无损压缩)的视频是最好的,然而,此时的存储和通信就很困难。存储要求以100 000小时的视频量计算,因为这是中型广播的最常用数量。在这种情况下还要考虑并行的很多格式的使用。

严重影响内容保存的一个因素被称为生成缺失问题。这种影响是指在制作过程中的每一步当其参与到材料的解码和重新编码时,素材的质量都会降低。使用有损压缩方法,每次材料被解码、处理和重新编码时都会发生质量的降低。这些情况甚至在高带宽的格式中也会发生,如MPEG-2的4∶2∶2 P@ML和50Mb/s时的DVCPRO50。在不同种类制作和通讯基础结构中,这种情况是严重的问题。另一个在存储时有可能发生的有关格式的主要问题是,过时格式不能再被处理,它和存储器恶化一样是每年都会发生的、可以预见的内容缺失的原因。

有很多视频专有格式的编码和压缩技术并没有完全完成,例如Real视频作为一种浏览和因特网传输格式或者基于动态JPEG制作的格式被广泛使用。这些格式应该在内容管理系统中被有效地管理,可是这些格式的功能和交互性在系统中却受到了限制,例如只能用本地工具流化、操作和处理专有格式。当不知道编码格式和结构时,素材编码成的专有格式只能被当作文件使用。只有当能够处理这种格式的工具可以被集成进内容管理系统中作为服务或应用组件时,才能进行更加复杂的交互操作。因此选择视频格式的准则之一就是支持这个格式的工具是否可以容易地被集成到系统中去。

3.4音频

和视频一样,音频可以被归类为连续媒体素材类型,如时间应该被看做是显示的语义中的一部分。和视频一样,音频在内容管理系统中被管理并且通常用低码率的副本来表示(音频)内容。音频和视频的许多参数标准都相同,不同的是音频对于量化方面的要求(如带宽和存储要求)比较低。不同的应用领域使用了不同的音频格式。在内容管理系统中这些数据必须被管理、转化到第三方系统中,并且(在应用层)展示给用户。音频在系统中可以是视频的一部分也可以是独立的组成部分。

在这一节介绍音频编码和主要压缩标准的原理和基础。

3.4.1音频编码:基础和原理

声音是通过物质的震动而产生的,同时也引起周围介质的压迫震动(通常为空气)。震动产生了规则频率(周期)的波,它通过空气传播,当到达人耳时,人们就听到声音。声音的频率是周期值的倒数,单位是赫兹Hz(周期每秒)或者千赫kHz(1kHz=1 000Hz)。人耳能够听到的频率范围是20Hz~20kHz。音调的大小取决于振幅(波偏移平均值的幅度)。

为了数字化地表示声波,可以用模数转换器(Analog-to-Digital Converter, ADC)来抽样,抽样率的单位也是Hz。标准CD抽样率是44.1kHz(即声波以每秒44 100样点进行抽样)。ADC的反向过程是数字到模拟的转换(Digital-to-Analog Conversion, DAC),它把数字信号转换成声波。应用ADC量化之后,接下来的数字化数据就可以被压缩了。不同的音频格式能够达到不同的目的。例如,电话的音频以8kHz抽样、8比特μ编码量化,而CD质量的音频用16比特的线性脉冲编码模式(Pulse Code Modulation, PCM)。从以上论述可知,决定数字音频质量的2个因素是抽样率和抽样量化程度。

CD质量的数字立体声音频的数据率是:

2×44 100(每秒)×16(比特)=1 411 200(比特每秒)

应用其他脉冲编码模式可以得到质量无损的结果。

波形格式(WAVE)常作为无压缩的数字立体声音频的参考格式。WAVE基本上是一种文件格式,它定义了可以作为文件的一部分的编码音频。而更重要的是,它定义了数据怎样打包成为一个文件和能够被转化为文件的元数据的类型。标准明确提到适合WAVE的2个编码规则(MPEG和PCM)。无压缩音频的WAVE编码模式是以上提到的以44.1kHz的抽样和PCM编码、双声道CD质量的立体声音频。另一种常用的无压缩格式是48.0kHz PCM编码的无压缩音频,它被用在数字音频磁带(Digital Audio Tape, DAT)上。

3.4.2基于MPEG的音频格式

MPEG不仅定义了有多元音频的标准视频,也独立定义了音频。所有相关的MPEG编码标准(例如MPEG-1、MPEG-2和MPEG-4)都涉及音频。

3.4.2.1MPEG-1音频

具体的MPEG-1音频编码与压缩数字音频CD和数字音频磁带(Digital Audio Tape, DAT)是兼容的,它们都是44.1kHz或48kHz抽样,16比特量化。此外还定义了32kHz的抽样频率。

在MPEG-1中定义了3个不同的层,每个层代表不同的编码、解码复杂度和表现水平。层与层之间向下兼容,例如高级的层必须能解码低级层的MPEG-1音频信号。音频文件通常编码成为MPEG-1的第三层,因此被称为MP3。

压缩开始于利用快速傅立叶变换(Fast Fourier Transformation, FFT)的频率转换。在此过程中,频谱被分成32个没有插帧的分波段。接下来计算每个分波段的音频信号的放大。与FFT同时进行的是用心理声学模型来定义每个分波段噪波,该过程的结果决定了量化过程。分波段的噪波水平越高,量化水平就越高。层1和层2的量化用PCM,层3的量化用霍夫曼编码,而最终的压缩步骤用熵编码。

MPEG-1中定义的音频编码有单信道、2个独立信道、双信道立体声和混合立体声。后者中的冗余信息可以去掉,以达到较高的压缩率。对于每个层的编码信息流都定义了14个不同的比特率(根据其不同的比特率索引)。每层的最小值是32kb/s,最大值各不相同。第1层允许的最大比特率为448kb/s,第2层允许的最大比特率是384kb/s,第3层是320kb/s。第3层还可以支持可变的比特率。第2层对于不同的信道有不同的限制要求。

3.4.2.2MPEG-2音频

MPEG-2标准包含和提高了MPEG-1音频标准。例如,它也支持16kHz、22.05kHz和24kHz的抽样率(MPEG-1抽样频率的一半)。这使比特率降低到64kb/s以下,同时MPEG-2的音频部分标准用相对低的比特率支持多信道。有多达5个的全带宽声道:左、右、中间双环绕声道以及一个提高低频质量的声道,而且还支持多达7个信道的不同语言。

同类推荐
  • 实用行政文书写作大全(现代常用文体写作全书)

    实用行政文书写作大全(现代常用文体写作全书)

    本书内容包含:公文的起草、校核和签发;办公文书的写作,会议文书的写作,行政公文的写作,规章文体的写作、其他公文写作八章。
  • 论新闻学学科地位及发展

    论新闻学学科地位及发展

    本书以新闻学学科建设为主线,集中反映了作者关于新闻学学科地位及学科发展问题的一些理论思考,表达了作者“保卫新闻学”和“发展新闻学”的学术见解与理念诉求。本书集中展现了作者在新闻学学术研究方面的志趣及成果,同时从一个侧面折射出进入新世纪以来我国新闻学研究的发展轨迹,并在一定程度上显示出了我国新闻学理论传承与创新的研究方向。本书可作为新闻与传播院校师生、新闻实务工作者研修新闻理论的参考书,也可作为新闻学与传播学研究生进行上述方向专题研究的辅助教材,同时对撰写新闻学术论文也有一定参考价值。
  • 珞珈兰台文集

    珞珈兰台文集

    本书收录39篇论文,主要围绕武汉大学的档案工作,展开专题研究。内容涉及到档案馆的基本建设、人员的管理,档案的监督指导工作,档案的安全保管工作,档案的信息化工作以及档案的开发利用工作等。
  • 中国报业集团法人制度变迁研究

    中国报业集团法人制度变迁研究

    国内第一本从民商法学视角考察中国报业集团法人制度变迁史的学术专著。全书以新闻出版改革为背景,以转型期各报业集团法人定位的不同时段为经,以各家报业集团在三个时间段的不同表现为纬,深入细致地论述中国报业集团从事业法人走向企业法人的转变原因、发展进程、组合模式、未来发展等方面的异同,旨在探寻建设中国一流报业集团、实现中国文化产业腾飞的发展路径。对于深度了解当代中国报业集团的体制机制改革,为中国报业集团的做大做强提供理论支撑,对丰富和发展中国报业理论有一定意义。
  • 第三只眼睛看教育:5位海外华人学者的教育省察

    第三只眼睛看教育:5位海外华人学者的教育省察

    本书除主编外,另邀请4位海外学者(薛涌等),立足中国教育的现况,以国际的视野,对中国教育的诸多问题进行理性的分析和解释,旨在为中国教育的健康发展献计献策。此书5位作者皆博览群书,但不书生意气,目光锐利,但笔端温情理性。
热门推荐
  • 麻醉师

    麻醉师

    春天的夜晚弥漫着丝丝温暖和不安,纷乱的思绪在马超越的脑子里疯狂蠕动。他坐在电脑前,脸上布满了焦虑和凝重。有一个小说,构思早已成竹在胸,但是,每当马超越坐在电脑前准备写时,他却像中了邪似的失去了语言表达能力,一个字也憋不出来。想写而写不出的矛盾,在马超越心中沉积已经很久了,他心急如焚,可效果并没有因为着急而有丝毫的改善。尽管如此,他也没打算放弃这次注定要经历磨难的写作。马超越默默地在心里发了誓,事在人为,一定要将构思变成震撼人心的作品。在马超越的构思中,这是一部非常奇特的小说,与他自己有着复杂而神秘的关联。
  • 九霄丹神

    九霄丹神

    跌落凡尘,却成世家废柴,两世为人,幸抑或不幸?当记忆复苏的那一刹那,该如何抉择?屈于命运,还是奋起抗争?且看林峰,以丹定乾坤!
  • 老板忠告员工

    老板忠告员工

    美国《时代周刊》杂志资深记者惠德曼·丹尼斯用了大约一年多的时间先后采访了一百个知名企业的老板和总裁,征求他们对员工或部属的看法、期望和要求,并请他们以老板的身份以及对企业、对员工前途高度负责的心态,给员工提出善意的忠告、真挚的嘱托和殷切的寄语,当然还有一些话头话尾的警示,一些明里暗里的戒则,一些深中肯綮的劝勉。这些话差不多是每一个老板对员工一直想吐露的心声,其中有些内容是老板们讳莫如深的。
  • 重生变成自己的姐姐

    重生变成自己的姐姐

    一觉醒来,我完了!我居然变成了一个女人?!!还是原来自己的姐姐!!怎么办?凉拌!看哥如何用一男儿魂,女儿身站到人生巅峰。“姐!小心肝!小心肝!”“没事,小宝贝儿。哎呦我去!”“都说了小心肝了”
  • 老房子掠影

    老房子掠影

    《国家地理·神秘中国》是一套以地域事件为单元散点透视、实地实拍、实证实录的图书,从地理人文风貌,到社会历史心态,有记录,有拍摄,有考察,有论证,从不同的角度和侧面,把历史之树的绚丽风采展示给大家。从社会生活的细节上,揭开历史的面纱,看一看神秘中国的精彩。每本书中围绕同一主题生发出的不同故事,就像几片相似的树叶,为中华历史的大树平添几抹生命的绿色。在这里,我们即将看到:秀丽的山川,古老的城镇,尘封的遗迹,神秘的陵寝;我们将接触到:奇石美玉,奇异建筑,珍贵遗产,传奇人物……
  • 不伸手不计较不抱怨

    不伸手不计较不抱怨

    第一部分功劳不伸手、第一章把荣耀的桂冠让给别人——功劳不伸手、责任抢着担,功劳大家分、罗马不是一个人建成的,功劳是大家的、为了前程,功劳面前上司优先、别企图霸占同事的劳动成果、才高不必自傲,慢点儿邀功请赏、替下属戴上“功劳的勋章”、在取得功劳之前,要先学会付出、舍弃多余的一切,反而更快乐。
  • 末世大小姐

    末世大小姐

    原本是千年难遇的红色流星雨,却带着令人类灭绝的危险病毒,14000公里的距离,7个国家的路程,远在千里的亲人,失踪的爱人,未知的命运。她如何在丧尸纵横,野兽肆虐的末世中艰难求生,如何穿越各个国家寻回自己唯一的亲人。丧尸、变异、人性、陷害,她又如何化险为夷。亲情、友情、爱情、生死,她一项都不会放手!
  • 我要做好孩子

    我要做好孩子

    跟随著名儿童文学作家黄蓓佳,从中你能看到一位作家温暖细腻的内心和五彩缤纷的生活。作者在青春岁月中笑过、哭过,有欢乐也有哀愁,就像一个诱人的青苹果一样,甜美而又略带酸涩。她带你行走在世界的各个角落,看一看别处的人们过着怎样的生活。
  • 礼仪常识(现代生活百科)

    礼仪常识(现代生活百科)

    有很多人都非常羡慕那些有风度、有气质、待人彬彬有礼的人,并且渴望着自己有一天也可以成为那样被人羡慕、受人尊敬的人。可是,却很少有人去认真、仔细地思考过,他们怎样才能成长为那样具有风度和气质、且待人彬彬有礼的人呢?其实,那些人之所以在人群中显得与众不同,显得耀眼,全是因为他们独有的人格魅力,那是一种由内而外散发出来的韵味,而“知礼”便是促成这种魅力的重要因素。正是因为他们注意一些礼仪上极为细小的问题,才获得意想不到的收获。
  • 曹操墓真相

    曹操墓真相

    “鲁潜墓志”泄露了什么。西高穴,豫北大地上一个毫不起眼的小村庄。说它不起眼,在于它的规模与建筑没有特别之处。该村现今人口不足三千,百十间瓦房,聚集在一起,略显得有些杂乱。村中的小路,狭窄而泥泞。这样的村庄,在豫北地区到处都是。西高穴三个字,似乎隐藏着某种秘密。西,自然指方位,但“高穴”是什么呢?没有人能够作出合理解释,于是留下一个谜。西高穴村位于河南安阳市区西北16公里处,行政上隶属安阳县安丰乡。该村西依太行,北临漳河。当地人往往以“依水临峰”来描述周边环境。