基于Copula函数的洪峰洪量联合分布研究(侯芸芸 宋松柏)

标签:
流域结语每年情况洪量两 |
分类: 知书识理,自圆其说 |
基于Copula函数的洪峰洪量联合分布研究
(侯芸芸 宋松柏)
摘要: 采用Archim edean Copula函数族中的4种函数,以陕北地区神木站48 a的洪水资料为例进行了洪峰和洪量的联合分布及两变量的联合重现期计算。结果表明: 通过相依性度量,神木站洪峰和洪量有较高的相依性; Fank Copula函数拟合洪峰和洪量的联合分布效果较好; 运用Copula函数进行洪峰洪量联合分布的计算相对简单、灵活,可应用于多变量水文频率分析计算。
关键词: Copula函数; 洪水频率分析; 联合分布; 洪峰; 洪量
中图分类号: P333 文献标识码: A do:i 10. 3969 / .j issn. 1000-1379. 2010. 11. 017
洪水特性包括洪峰流量、洪水总量、峰现时间、洪水历时等。现行的洪水频率分析中,一是局限于采用单变量分布进行洪水特征量频率分析,忽略了洪水总量、峰现时间、洪水历时、洪峰流量等因素之间的相关关系,不能全面地描述洪水特征[1] ; 二是应用多元正态分布或者采用具有相同的边缘分布描述多变量联合分布[2]。这两种方法都不能全面地描述洪水事件的内在规律和分析各个特征属性之间的相互关系。
Copula函数[3- 5] 是构建多变量联合分布的一种有效方法,可以构造边缘分布为任意分布的多变量联合分布函数,描述变量之间的相关性结构,具有极强的适应性和灵活性。在多变量水文分析计算中,Copula 函数理论主要应用于洪水频率、降水频率、干旱特征分析、洪水或降水遭遇问题以及水文随机模拟等方面[6- 10] 。笔者以陕北神木站为例,应用Archim edean Copula函数构建边缘分布均服从P-Ⅲ型分布的最大洪峰流量以及洪量之间的联合分布,进行洪水事件的联合分析,推求洪峰、洪量两变量的联合分布函数以及联合重现期,并且将两变量联合分布结果与单变量的洪水频率分析结果进行比较,以期为陕北地区水利工程规划和防洪抗灾提供依据。
1 Copula函数和重现期
Copula函数是定义在[0,1] 区间均匀分布的联合分布函数。设H 为一个n 维分布函数,其边缘分布为F1、F2、…、Fn,则存在一个n- Copula 函数C,使得对任意x∈Rn,有
H (x1,x2,…,xn) = C [F 1 (x 1),F 2 (x 2),…,Fn (xn) ] (1)
若F1、F2、…、Fn 是连续的,则C 是唯一的; 若C 为一个n -Copula,则F1、F 2、…、F n 为分布函数。Copula 函数分椭圆型、二次型和Archimedean型三大类。目前,水文领域最常用的是Archimedean Copula函数族中的函数,主要有以下几种。
(1) Gum be l- Hougaard (G- H) Copula函数。
C (u,v) = e- [(- ln u)θ+ (- ln v)θ] 1 /θ θ∈[1,%) (2)
(2) Clayton Copula函数。
C (u,v) = (u-θ+ v-θ- 1) - 1/θ θ∈ (0,%) (3)
(3) Ali-Mikhail- Haq (AMH) Copula函数。
C (u,v) = uv / [1 -θ(1 - u)
(1 - v) ]
(4) Frank Copula函数。
W020110927606377900070.jpg宋松柏)" TITLE="基于Copula函数的洪峰洪量联合分布研究(侯芸芸
式中: C 为2- Copula; u 和v 均为边缘分布函数,u = Fx (x) ,v =Fy (y); θ为Copula函数的参数。
在洪水事件中,人们通常关注的是洪峰和洪量超过某一特定值的概率。因此,洪水频率计算主要是用来确定一定频率下的设计洪水值或者是一定洪水设计值下的设计标准,即重现期。设洪水事件中的两个特征变量为X 和Y,单变量洪水重现期为
T (x) = 1 / [1 - Fx (x) ] (6)
T (y) = 1 / [1 - Fy (y) ] (7)
式中: T (x) 为单变量X 的重现期; T (y) 为单变量Y的重现期。
对于两变量重现期,一般有两变量联合重现期和两变量同现重现期。两变量联合重现期表示水文事件中水文变量X 或Y超过某一特定值,计算公式为
W020110927606378063764.jpg宋松柏)" TITLE="基于Copula函数的洪峰洪量联合分布研究(侯芸芸
两变量同现重现期表示水文事件中X 和Y都超过某一特定值,计算公式为
W020110927606378068850.jpg宋松柏)" TITLE="基于Copula函数的洪峰洪量联合分布研究(侯芸芸
2 变量相依性度量
因为Copula 函数是用来刻画变量间相依关系[11] 的函数,所以首先应进行随机变量间相依性的度量。相关系数ρ只能刻画具有线性关系的相关性,对于非线性关系则不能取得正确的结果,因此人们常用Kendall秩相关系数和Spearman秩相关系数[12] 来进行相依性度量。
对于洪水样本(xi,yi),i= 1,2,…,n,Kendall秩相关系数的计算公式为
W020110927606378062132.jpg宋松柏)" TITLE="基于Copula函数的洪峰洪量联合分布研究(侯芸芸
式中:τ为Kendall秩相关系数; (x i,yi) 为实测点据; n 为系列长度。
Spearman秩相关系数的计算公式为
W020110927606378220083.jpg宋松柏)" TITLE="基于Copula函数的洪峰洪量联合分布研究(侯芸芸
式中: ρn 为Spearman秩相关系数; R i 和Si 分别代表变量X 和Y的秩次。
Copula函数包含了随机变量的全部相关信息,无论是Kendall秩相关系数还是Spearman秩相关系数,都可以用Copula函数进行唯一的表示[13] :
W020110927606378226193.jpg宋松柏)" TITLE="基于Copula函数的洪峰洪量联合分布研究(侯芸芸
3 Copula函数参数估计
3. 1 边缘分布函数参数估计
单变量分布函数的参数估计一般采用矩法、极大似然法、权函数法、线性矩法、适线法等方法进行估计,笔者采用矩法进行参数初估,再运用离差平方和最小法[14] 对参数进行优化,以得到拟合较好的参数值。计算公式为
W020110927606378221423.jpg宋松柏)" TITLE="基于Copula函数的洪峰洪量联合分布研究(侯芸芸
式中: SL (θ) 为离差平方和最小法的目标函数;φ为离均系数;Pi 为频率; x i 为洪水特征量的观测值; x为洪水特征量的均值;CV 为洪水特征量的变差系数; CS 为洪水特征量的偏态系数; n为系列长度。
3. 2 Copula函数参数估计
常用的Copula 函数参数估计方法有极大似然法[15] 、相关性指标法[16] 、IFM 估计法/M BP估计法[17] 等。其中,相关性指标法主要是运用Copula 函数的参数θ与Kendall秩相关系数之间的关系(见表1)来间接计算参数θ,其他方法主要是运用似然思想的计算方法。
表1 Copula函数的参数θ与Kendal l秩相关系数τ之间的关系
W020110927606378370762.jpg宋松柏)" TITLE="基于Copula函数的洪峰洪量联合分布研究(侯芸芸
4 拟合优度评价
为了了解选定的Copu la 函数能否描述变量间的相关性结构,需要对Copula 函数进行拟合检验。为了检验两变量的理论联合分布函数在洪水频率分析中的拟合程度,一般将各个观测点据(xi,yi) 的经验联合分布和理论联合分布进行比较。计算经验联合分布的公式为
W020110927606378379631.jpg宋松柏)" TITLE="基于Copula函数的洪峰洪量联合分布研究(侯芸芸
式中: nm,k为同时满足X≤x i 和Y≤y i 时联合观测值的个数。
拟合优度评价是选择联合分布函数的重要指标。常用的检验方法有离差平方和最小准则法、AIC 信息准则法[18- 19]以及OLS 方法。笔者采用AIC 信息准则法进行拟合优度评价。
(1) AIC 信息准则包括经验点与理论Copula函数拟合的偏差以及Copula函数的参数个数导致的不稳定性两部分。
W020110927606378377104.jpg宋松柏)" TITLE="基于Copula函数的洪峰洪量联合分布研究(侯芸芸
式中: Femp (x i,yi)、C (ui,vi) 分别为经验频率和理论频率; k 为模型参数的个数。AIC 值越小,Copula函数拟合得越好。
(2) 采用离差平方和最小准则(OLS) 来评价Copula方法的有效性,并选取OLS 最小的Copula作为联结函数。OLS 的计算公式为
W020110927606378535413.jpg宋松柏)" TITLE="基于Copula函数的洪峰洪量联合分布研究(侯芸芸
5 实例应用
以陕北地区神木站48 a的洪水资料为例,选取该站每年的最大洪峰流量和洪水总量作为洪水特征变量,计算洪峰和洪量的联合分布函数以及联合重现期。
5. 1 相依性度量
运用式(10)和式(11)分别对神木站洪水资料进行洪峰和洪量的相依性度量,得τ= 0. 781 9、ρn = 0. 929 1。由此可见,神木站洪峰和洪量之间存在较高的相关性。因此,可以运用Copu la 函数建立两变量的联合分布函数。
5. 2 边缘分布函数参数以及Copula函数参数的确定
采用P- Ⅲ型分布作为洪峰和洪量的单变量分布函数,运用矩法进行单变量的参数初估,再对初估值进行优化。计算得到洪峰的均值、变差系数和偏态系数分别为x = 3 608. 96 m3 / s、CV = 1. 09、CS = 1. 99,洪量的均值、变差系数和偏态系数分别为x = 5 026. 7万m3、CV = 0. 95、C S = 1. 52。
由Kendall秩相关系数 = 0. 781 9,通过Copula 函数的参数和Kendall秩相关系数之间的关系式(表1),分别求出4种Copula 函数的参数值,得到G- H Copula函数、Clayton Copula函数、AMH Copula 函数和Frank Copula 函数的参数分别为
4.585 4、7. 170 7、0. 8933和16. 514 6。
5. 3 拟合优度评价
将计算得到的经验联合分布值和用4种Copu la函数计算得到的理论联合分布值分别点绘在图中(见图1) ,可以看出其均分布在45°线附近,拟合效果比较好。因此,说明所建立的联合分布函数是合理的。
W020110927606378535968.jpg宋松柏)" TITLE="基于Copula函数的洪峰洪量联合分布研究(侯芸芸
图1 经验联合分布与理论联合分布的拟合
为了选择拟合最好的Copula 函数,利用AIC 信息准则和OLS 准则进行拟合优度评价,由式(19)、式(20)和式(21)得到G – H Copula 函数、Clay ton Copula 函数、AMH Copula 函数和Frank Copula 函数的AIC 值和OLS 值(见表2),可见Frank Cop?u la函数拟合最好。
表2 运用AIC信息准则和OLS 准则进行拟合优度评价
W020110927606378537065.jpg宋松柏)" TITLE="基于Copula函数的洪峰洪量联合分布研究(侯芸芸
5. 4 变量重现期等值线以及联合分布函数图的绘制
给定重现期分别为1 000、500、100、50、20、10 a和5 a,绘制Frank Copula 函数下的重现期等值线图以及联合分布函数图,根据等值线图就可以得到任意重现期下两变量的各种组合(见图2、图3)。
W020110927606378693005.jpg宋松柏)" TITLE="基于Copula函数的洪峰洪量联合分布研究(侯芸芸
5. 5 单变量分析以及两变量联合分布分析的比较
采用洪峰和洪量为同频率的假定,通过单变量洪水频率分析法得到不同频率的设计洪峰和设计洪量值,以及基于FrankCopula 函数计算两变量联合分布下的设计洪峰值和设计洪量值,给定一定重现期,由式(5) 反求得各个重现期下的同频率值,即u = v的情况,再通过边缘分布函数的逆函数求得相应的洪峰或者洪量值。
14Q = Fx -1(u) (22)
W = FY- 1 (v) (23)
式中: Q 为洪峰值; W 为洪量值。
同时可以计算得到在联合设计值下的重现期(见表3)。
表3 不同重现期的洪峰和洪量值
W020110927606378696638.jpg宋松柏)" TITLE="基于Copula函数的洪峰洪量联合分布研究(侯芸芸
由表3可以看出,在一定设计重现期下基于两变量联合分布计算得到的洪峰和洪量值均大于由单变量计算得到的设计值,各特征值的重现期也高于设计重现期。因此,基于两变量联合分布得到的洪水频率分析计算结果较单变量的计算结果偏于安全。
6 结语
以陕北神木站48 a的洪水资料为例,采用Archimedean Copula函数中的4种函数建立边缘分布为P-Ⅲ型分布并具有较高相依性关系的洪峰和洪量的联合分布;通过拟合优度检验得到Frank Copula 拟合效果最好,可用于计算陕北神木站的联合分布; 将Frank Copula函数的两变量联合分布的洪水频率计算结果与单变量洪水频率计算结果进行比较,得到两变量联合分布的结果较单变量的偏于安全,并绘制出联合重现期的等值线图以及洪峰和洪量的联合分布图。因此,基于Copula函数的两变量联合分布的洪水频率分析方法能更好地描述洪水特征量之间的关系,且对边缘分布类型没有限制,不失为洪水频率分析计算的一种较优算法。
参考文献:
[1]
[2]
[3]
[4]
[11]
[12]
[13]
[14]
[15]
[16]
[17]
[18]
[19]
作者简介: 侯芸芸(1984—) ,女,陕西凤翔人,硕士研究生,研究方向为流域水文模拟。