光谱数据平滑与滤波

分类: 遥感 |
近红外光谱作为非破坏性光谱检测,除了在光谱构造上呈现复杂性之外,样本的不规则性,测定环境等因素的变化也会引起光谱的不规则运动(李民赞,2006)。
近红外光谱数据处理的目的和难点就是要将影响光谱的各个主要因素相互分离,从复杂的光谱中消除掉不需要的变动,最后分离出需要的有用信息,借助于计算机软件和数据处理方法建立定标模型(李民赞,2006)。
样本近红外光谱的复杂性包括了以下的几种形式:
1、样本是由多种化合物组成,近红外光谱反映的是吸收峰的多重的叠加。各成分的浓度相关信息分散于很广的波长范围内,使得构成光谱的各个波长之间有着直接的很强的相关性,称为多重共线性。
2、测量时采用的是漫反射测量技术。当光线照在样品上时会产生各种反射,散射,透射。然而,漫反射光谱则由于样品的多重散乱现象使得Lambert-Beer线性法则不成立。引起吸光度与样本浓度呈现非线性。
3、近红外光谱受到样本的表面形态,内部构造等样本特征和温度,光照,试验条件等环境因素的影响会使光谱产生基线变动和附加散射变动。
4、近红外在光电变换,信号处理过程中不可避免的会产生随机噪声误差,并且当样本单一成分浓度过高时会对掩盖掉微量成分信息,对近红外检测性能产生影响。
光谱平滑的基本思路是在平滑点的前后各取若干点来进行平均或拟合,以求的平滑点的最佳估计值,消除随机噪声,这一方法的基本前提是随机噪声在处理窗口内的均值为0。对于光谱数据进行平滑数据处理的方法也叫数字滤波。
平滑算法一般可用下式来表示:
为k点(中心点)平滑后的值,
光谱平滑可以有效的消除高频噪声,平滑点数越多,去噪的效果越好,同时越容易引起信号失真,降低光谱敏感度。
移动平滑:不同窗口的跨度相互重叠,就像窗口依次移动平滑,取窗口内数据点数(2r+1)的平均值来代表窗口内的中间数据。采用移动平均法对光谱进行平滑时,并没有消除光谱的噪声,反而减低了光谱的敏感度,使得预测模型精度降低。
S-G(Savitzky-Golay)卷积平滑:是利用最小二乘拟合系数作为数字滤波响应函数来对光谱进行卷积平滑处理的方法,这种方法广泛运用于信号的滤波处理。一般可用下式来表示:
其中:
最小二乘拟合能够改善光谱噪声,去掉高频成分,但去噪的效果并不明显,随着平滑点数和多项式次数的增加,光谱的敏感性开始降低,模型精度下降。
高斯(ganss)滤波是根据高斯函数的形状来选择权值的线性平滑滤波。高斯平滑滤波对于去除服从正态分布的噪声很有效果。一维均值高斯滤波函数为:
其中:参数σ决定了高斯平滑滤波的宽度(王怀野等,2005)。
采用高斯平滑滤波法对光谱的去噪能力有限,对模型精度改善不明显。
多元散射校正(MSC):在漫反射光谱测量时,由于样品本身的不均匀性常导致所测的样本光谱具有很大的差异性。不同批次不同编号的鸡蛋样本所测的光谱从表面看就有差异。一般情况下,散射引起的光谱变化甚至大于样本成分引起的变化。多元散射校正(MSC)不仅可以修正透射光谱测量过程中的光程长误差,而且可以消除反射光谱和扩散透射光谱过程中的光散射影响。多元散射校正(MSC)算法如下:
第一,计算所有样品光谱的平均光谱。
第二,将每个样品的光谱与平均光谱进行线性回归,求得回归系数
http://img0.ph.126.net/evEWRuNEF0uuSPIS_samgg==/3288190678033975359.png
第三,计算校正后的光谱:
其中:i=k=1,2,…,m,为样品数;j表示第j个波数。