信息的建立、表示和交换,以及信息载体的收集、组织和存储是一个很古老的行业。图书馆和档案早就存在于古埃及、巴比伦、中国以及所有先进的文明古国。这可被认为是处理媒体和保留信息的早期文化发展的一部分。因此,可以说内容管理已有上千年的历史,只是在当今的信息社会里,需要处理的信息量、信息产生的速度、媒体的种类及使用的格式有所不同。在19世纪到来之际,连续媒体(如电影和音频)被增加到传统的离散媒体格式中。在20世纪的最后20年,新的数字多媒体格式(如数字音频和视频,还有网页和超文本文档)出现了。所有这些不同的媒体格式都要在产生它的组织内部管理,包括进行各种形式的内容处理、存储和传送。
现在,另一个影响内容管理方式的趋势是,内容的建立不再是线性过程。内容是从代表不同媒体和信息种类的文章中集合而来的。原始的电影胶片、电影工作样片、现存的档案材料和附加的纪录都被用于建立视音频媒体对象。数据单、脚本、生产计划和过程指令等各种类型的文档伴随着内容生产过程产生出来。在整个内容生产过程中,信息周转的时间必须大大减少,同时,所有参与的小组都要能够访问和使用内容的各个组成部分。因此,内容管理系统并不是最终的存储库,而是内容建立和传送的中心环节。
在最近几年,我们可以体察到媒体产业的变化。随着万维网的出现,传统印刷媒体、广播电视公司和娱乐公司之间的区别变得越来越模糊。大多数媒体公司都拥有自己的网址。广播电视公司不仅可以通过已建立的渠道传播,而且可以利用数字广播电视技术进行传播。还有,音乐唱片和视频在当今不仅通过传统的零售商销售,也可通过电子渠道推销。事实上,内容(尤其是信息)不同于金融产品,它是可以进行电子处理和传送的商品。
此外,越来越多的非媒体组织正面临着怎样处理他们的内容的问题。大的企业有采用多媒体存储的促销材料和公司档案,教育机构正在用的视听报告材料也需要管理。博物馆、旅游景点、乡镇和城市也要处理不断增加的、需要保存的内容。还有,电信公司也正由纯网络提供商发展为服务公司。他们一致认为媒体和娱乐市场是一个有增长潜力的领域。为了抢占这个市场空间,他们必须管理媒体并提供其所需的信息。因此,内容管理不仅仅是传统媒体产业要解决的问题,也是各类研究机构和组织要解决的问题。
然而,这种普遍存在的、无所不含的通用内容管理系统迄今为止还未出现。许多产品自称是内容管理系统,声称能够提供一般的或至少是基本的内容管理支持。然而,他们都是在某一特定行业内开发的,因此都集中在某些方面且具有某种特色。直到现在,还没有哪一种开发出来的平台既可用于小型研究所的内容管理,又可用于支持富内容的组织的媒体生产过程以及档案管理。由于不同的应用要求千差万别,建立这样一个通用系统的可行性便更加值得商榷。
本书涉及专业媒体生产、处理和传输环境中的内容(或者叫媒体资产)管理的所有方面。重点关注广播电视产业,但也考虑其他富内容的组织需求;论述了从媒体进入到系统、经过生产的各个阶段到最终的文件归档等整个工作流中的每个环节;并且介绍了主要的媒体格式和编码原则,讨论了系统中内容的表示方式;在后面的章节中还介绍了元数据标准和框架。本书的核心是探讨内容管理系统的体系结构和基础结构。既然这样一个系统是现存环境和可能建立的操作的一部分,那么整合应被作为一个很重要的方面加以考虑。应用是系统最可见的部分,因此理应对它们做适度的介绍。本书的最后讨论了未来的发展趋势。
进一步细化一下,本书做了以下的组织和讨论:
第1章的余下部分定义了内容的概念,介绍了问题的范围。对内容管理所能发挥重要作用的不同领域进行了讨论。
第2章介绍了处理内容的不同组织和个人,并讨论了与内容处理和管理的环境相关的许多工作流。这些工作流包括非媒体生产领域,如电子商务、教育和培训、市场营销等的内容管理。
第3章探讨的重点是内容管理系统所要管理的相关媒体格式,包括介绍基本编码和压缩原理,讨论相关的视音频格式和它们的结构。重点是标准化的、公开的格式,这些格式通常是媒体生产和广播电视产品的基础。这一章还对图像和结构化文档的格式进行了大致描述。在这一章最后部分介绍了自动化媒体生产过程的原理,这些原理是视频、音频和语音分析工具的基础。
第4章集中讨论了有关内容和元数据的表示法。为了管理媒体并借助媒体工作,在进行表示和描述时要考虑所有相关的观点。本章的第一部分讨论了系统内表示内容的不同方式。接下来介绍了相关元数据的描述方案和标准。在这个领域存在大量的首创,因此,了解它们的原理以及能够区分它们的目标和结构是很重要的。最后,还对相关元数据传输和交换标准的进行了讨论,如XML和SOAP。
第5章集中讨论了文件的格式,这些格式都是与特殊的内容生产和管理相关的。文件格式包括实际的媒体编码格式和相关内容的描述性信息。本章主要讨论人们为专业系统建议的格式,同时也对涉及的其他多媒体文件格式进行了讨论。
第6章提出了一个内容管理系统的体系结构。这个结构框架包含了在专业环境中进行内容管理所要求的所有要素。这个体系结构包含许多核心的要素、服务和处理内容及与系统交互所需的应用组件,并对不同的组件进行了详细的讨论。这个体系结构不是一个蓝图,而是一个参考的框架,该框架包含了与内容管理相关的主要组件。
第7章解释了内容管理系统的基础结构和它的各种不同的组件。体系结构专注于组成内容管理系统的软件模块,而基础结构表示组成内容管理系统和主机的不同软件模块的物理系统要素,也包括实际的内容(如以素材形式表示的媒体和描述性的元数据)。接下来详细讨论了不同基础结构的要素是如何支持管理和生产过程的。此外,操作方面的考虑如项目移植、成本和规模策略也在本章中进行了适当的讨论。
第8章讨论了系统整合问题。在一个内容丰富的组织中,内容管理系统是更大的结构中的一部分。在已建立的运营系统中,必须考虑遗留下来的内容以及现存需要整合或至少是需要协调的组件。更进一步说,内容管理系统未来可能将成为运营系统的中心。而且,也将有许多其他的系统会用于内容的生产和分配,例如演播室自动控制系统、非线性编辑系统、新闻工作室系统等。本章将会解释如何对它们进行整合或协调。
第9章给出了与专业内容管理系统相关的应用组件的一个总览。它介绍了基于组件的应用设计的概念,因为内容管理系统的应用需要高度的灵活性和可配置性。本章还简要介绍了一些用于建立实际应用的模块,然后列举了一些应用程序结构的例子用于解释用户是怎样把不同的需求放于系统中的,以及工作流是怎样被反映到应用程序中和它的用户界面上的。
第10章展望了内容管理的未来发展趋势。首先,简要介绍了相关的原创思想和标准化方面的工作。其次,总结了专业内容管理领域所取得的经验。最后,讨论了这一领域的未来发展方向。
1.1什么是内容
通常,内容一词是指任何种类的音频、视频、声音或者文本信息。在这种情况下,一个具体的媒体类型表示的内容可能有一个既定的表示周期(如一段视频或音频广播)。然而,在系统的环境中,内容具有永久存在和可获得的特性,即内容可以根据需要访问,或者在系统的某些特定时间去获得。内容可以按部分或整体的形式去生产、转换、传递、消费和交易。
内容的一般特征是很宽泛的,并没有给出任何量化的描述,也没有具体说明其不同要素。然而,这却反映了目前对这一词汇的通常用法。内容在被使用时具有不同的内涵(取决于上下文)和不同的方式,有时会描述完全不同的概念。
为了解决这个问题,电影与电视工程师学会(Society of Motion Picture and Television Engineers, SMPTE)和欧洲广播联盟(European Broadcasting Union, EBU)成立了一个特别任务组,专门用于解决内容和内容管理的相关问题。这个工作组在定义内容一词时是以媒体产业为背景来确定它的要素的。
根据工作组的定义,内容包括:
素材。
元数据。
这里,素材是指原始的节目原材料本身,通常以图片、声音、文本、视频等方式存在。素材含有实际的消息或者信息,被称为媒体。然而,媒体这个术语也被用于表示物理的载体,例如录像带、CD等。既然素材指的是一般意义的概念,并且它独立于物理载体,因此必须对它进行清楚的区分。本书决定使用“素材”(Essence)——这个较为专门的术语来特指编码的信息,它直接表示了实际的消息。按照EBU和SMPTE对素材的定义方式,本书通篇使用“素材”这一术语。
第二个内容要素是元数据。它被用于描述实际的素材和它的不同表示形式。元数据可做如下分类:
·与内容相关的元数据,它给出实际内容或主体的描述。
·与素材相关的元数据,它用于描述可用的格式、编码参数和记录的具体信息。
·与位置相关的元数据,描述内容的位置、数量和载体等的状况。
与内容相关的元数据包括正式的数据(如标题、副标题、存在的时间和演员表等)、索引信息(如关键字、图像内容描述和分类等),以及有关专利的数据(如专利所有者、获得的专利权等)。
根据不同的应用环境和领域,内容的2个组成部分(素材和元数据)具有不同的相关性。实际的素材用于使用和操作,元数据则用于描述、查找和检索内容。因此,在所有的应用中,元数据起着关键性的作用,即通过它实现对内容的挑选而不是表示(如应用在内容的生产过程、销售及个性化内容的传递中)。
一个既可以管理素材又可以管理元数据的系统被称作内容管理系统。管理素材的主要任务是对高容量、高带宽和一部分对于时间敏感的数字化数据的存储、管理和传递。在专业环境中,也包括对专业化生产和广播电视系统的集成(或协调)。内容管理并不局限于某个具体的部门,如档案库,它遍及一个内容丰富的组织中的所有部门。
元数据的管理主要涉及描述、存储和定位信息系统以及数据库中与内容相关的数据。除了传统的人工注解,还包括增强的元数据描述和通过如视频分析和语音识别工具等自动过程产生的索引信息。
1.1.1内容和知识产权
知识产权(Intellectual Property Rights, IPR)和数字版权管理(Digital Rights Management, DRM)属于相关领域,当在一起考虑它们时就形成了一个自我包含的问题域。版权管理包含2部分,版权管理(与内容对象相关的版权描述和版权文档)和版权保护。
对于版权情况不明确的内容在商业环境中是不能使用的。不遵守法律、契约规则和IPR而去使用内容可能会引起严重的问题。一个不了解其相关知识产权的内容对象对于一个组织来说是不具有任何价值的,因为它不能被开发。只有当版权明确,一个内容对象才能被展示、广播或交易。因此,当一个内容对象的所属权对一个组织是确定的时候,它就变成了一项资产,就能用于商业开发。
有些人甚至认为一个不具有适当版权的内容对象就是一项负债,因为必须要对它存储、管理和保存,但却不能在公共场合使用它。当然,保留不具有合适的知识产权的内容可能还有其他原因。例如,有许多研究所负有保留国家文化遗产的责任,因此他们所管理的内容对象就属于这一类。然而,这并不意味着他们有任何权利去开发这些内容。还有其他一些更为注重实效的保留内容的原因,它们对这些内容也不具有合适的版权或者版权不明确,例如,一些特殊的内容在某个特定的情况下可能会变得引人注目。有人认为只要在实际广播开始之前能明确版权的使用权就足够了,但为了方便快速地访问它们,他们会在自己的系统内保留一份这些内容对象的副本,即使在原始契约终止后也是如此。
根据这些考虑,在内容和资产之间要有一个明确的区分。本书主要论述内容和它的管理。内容对象也可以成为资产,在不考虑版权的情况下,同样也可以应用管理过程。然而,为了确保可信的、定义良好的术语的使用,我们在整本书中使用“内容”来表示这个定义。