标签:
微软亚洲研究院最新技术成果展示网络多媒体组多媒体2.0 |
分类: 技术 |
文:李世鹏
(李世鹏博士在给盖茨做最新技术成果演示)
在传统多媒体中,比如说在一段电影DVD中,用户如果想要搜索,可以通过快进、快倒的手段拉到他想看的地方。这些操作都很简单,也是很成熟的技术。但是,我们还可以怎么样才能更好地提高用户体验呢?Web开始时候大部分都是HTML (Hyper-Text Markup Language) 文件,文本文件比较多。文本文件为什么好处理?因为它们有一些很简单、自然的结构,从人类有文字以来一直是这样的。我们以一本书为例子,书里面有章,章里面有节,节里面有段,段里面有句子,句子里面有分句,分句里面有词组,词组里面有单词等等。但是,对于多媒体而来,则缺乏这种明晰的自然层级结构。有些多媒体内容,比如说DVD中虽有一些章节,但是很粗,不足以让用户很快找到或者跳到一个特定的场景。因此,很自然,在多媒体内容里怎么建立跟文本文件类似的结构,这可能是针对多媒体内容下一步要做的事情。把多媒体内容分解变成一个个很细小但又有一定层次结构的媒体单元,会更有效地对它进行搜索、管理、存取、编辑和制作。比如说,把一个电影分解成有意义的章(Chapter)、节(Section)、场景(Scene)、镜头组(Shot)、视频帧(Frame)以及一帧里面的物体(Object),就能对它越有效地进行处理,让用户可以更快找到想要的东西。这不但可以在同一个多媒体内容进行有效地搜索,也可以在互联网多媒体搜索中起到很大的作用。比如用户要搜索比尔·盖茨在什么地方演讲,不像现在大多数多媒体搜索技术只返回一整段可能包括比尔·盖茨演讲的视频内容,将来的基于这种细化的多媒体内容的搜索技术,能返回给用户比尔·盖茨演讲在一段视频里出现的精确位置,用户不需要浏览整个视频就可以马上跳到那一位置。
另外,现在的多媒体编辑系统几乎无一例外地在编辑后,用新的多媒体内容替代原始的多媒体素材。这样编辑后的新的多媒体内容完全失去了和用到的多媒体素材的联系,原来有关的数据都会丢失。根据格式细化的多媒体内容,我们完全能针对多媒体内容建立一套新的多媒体Web技术。它基本上和现在基于HTML的Web概念很类似,一个多媒体的web
网页,包含着来自其他网页的多媒体内容,这些内容是通过web
link联系在一起的,只有在呈现给用户的时候,它才实时地渲染出最后的媒体格式。这样的话,我们可以一直保持原始素材的出处和质量,不止于像传统编辑工具那样,丢失了关联数据和引进了重复编码的质量损失。这可能要求定义一种我们叫做HMML