视觉基础理论

分类: 学术专业类 |
http://s7/middle/66e4ee5d07391a8f8c326&690
纹 理 (texture)
图 1 是 FRAME 用于纹理分析与合成的例子。上图是观测图像,下图是采样结果。
Textons 是指自然图像中基本的微观结构,它是视觉感知初始阶段(预注意阶段)的基元。Textons 的研究在很多问题中都很重要。首先,将一幅图像分解为简单的图像基元能够减少冗余信息,从而设计更好的图像编码算法;其次,基于分解的图像表达方式能压缩图像的维度,减少变量之间的相关性,更有利于图像建模,而图像建模是图像分割和识别中不可或缺的一步;再次,在生物视觉中,自然图像中的微观结构为理解神经元在生物视觉系统初级阶段的功能提供了重要的生理信息。
Textons refer to fundamental micro-structures in generic natural images and the basic elements in early (pre-attentive) visual perception. In practice, the study of textons has important implications on a series of problems. Firstly, decomposing an image into its constituent components reduces information redundancy and thus leads to better image coding algorithms. Secondly, the decomposed image representation often has much reduced dimensions and less dependence between variables (coefficients), therefore it facilitates image modeling which are necessary for image segmentation and recognition. Thirdly, in biologic vision the micro-structures in natural images provide an ecologic cue for understanding the functions of neurons in the early stage of biologic vision system. However, in the literature of computer vision and visual perception, the word "texton" remains a vague concept and a precise mathematical definition has yet to be found. Here we show some study related to this topic.
调和分析( harmonic analysis )是用于图像成分分析的一个重要工具,在数学上它研究的是函数族的分解,傅立叶变换( Fourier transform ),小波变换( wavelet transform ), wedgelets , ridgelet 和图像分析中的图像塔表示等都属于调和分析的范畴。经过多年的发展,研究者一致认为,图像的最优分解集应该是从全体自然图像中学习得到的。很显然,和傅立叶变换、小波变换等最初处理的数学函数族相比,全体自然图像要复杂得多,因此,研究自然图像的统计特性和图像的微观结构就显得尤为重要。这里有两个具有代表性的研究工作:一种研究的重心是自然图像的统计特性,包括研究图像的尺度不变性,小图像块的联合分布,图像滤波器响应的联合直方图或者相关性等。另一种研究是,利用稀疏编码( sparse coding )的思想试图从自然图像中学习超完备的图像基底。和傅立叶变换和小波变换所采用的正交基或紧框架不同,这里学习出来的基底有很高相关性。
Textons 的研究是从第二种研究路线出发的,它试图解决这样一个问题:当图像的超完备基底学习出来之后,在这些基底上最基本的图像微观结构是什么?和物理概念作个类比,假如将稀疏编码中的图像基底比作质子、中子和电子,那么自然图像中的原子、分子是什么?又该如何从图像中学习这些结构?
Textons 的工作里,我们首先基于图像基元独立同分布的假设,验证了稀疏编码机制中的产生式模型。其次,抛开这个假设,在产生式模型下我们研究了图像基底的空间结构,并且将 texton 定义为由一些具有某种几何和光照信息的图像基底组成的微型模板。
图
a) 星型模式的 texton 模板
http://s12/middle/66e4ee5d483b0b3ef9afb&690
b) 基底如何组成星型图像
图 2. 星型模式从图像基底到 textons 的表达 (Zhu, Guo, Wu and Wang 2002)
原始简约图(primal sketch)
我们的研究为原始简约图给出了严格的数学理论,该理论分为四个组成部分:
( 1 )核心理论是将马尔可夫随机场( Markov Random Field, MRF )和小波理论( wavelet theories )结合提出了自然图像的原始简约图模型;
( 2 )结合 matching pursuit 和 filter pursuit,提出了 sketching pursuit 算法,该算法能从自然图像中自动搜寻图像的原始简约图表示。
( 3 )定义了图像的可描画性( sketchability );
( 4 )从图像的简约图表示学习出一个基元字典。
原始简约图模型有以下特点:
( 1 )通过计算可描画性( sketchability )的 sketching pursuit 过程,自动将图像分为可描画( sketchable )部分和不可描画( non-sketchable )部分,他们分别对应着图像中的结构和纹理;
( 2 )利用从自然图像中学习出来的视觉基元( visual primitives ),通过一个类似小波的产生式模型对图像中的结构信息建模;
( 3 )利用描述式模型( MRF 模型)对图像中的纹理信息建模;
( 4 )利用格式塔( Gestalt )场(一种描述式模型)对结构的空间信息建模。
2.1D
Sketch主要研究面物体,且不关心物体之间的深度信息,而只考虑它们之间的偏序关系(Partial
Order)。
2.1D Sketch的研究成果将会用于图像分割、图像编辑、艺术图像生成以及图像序列分析中。
http://s15/middle/66e4ee5d483b13b3a5f9e&690
http://s15/middle/66e4ee5d483b13c21c24e&690