统计学与金融工程
(2011-12-07 10:15:36)
标签:
极值统计学金融工程概率名校申请留学天道教育 |
统计学与金融工程
金融工程属于交叉性学科,包括以下3个领域:(1)投资分析;(2)风险管理;(3)期货交易。
其中投资分析与风险管理两个领域直接涉及到统计数据描述及推测统计学,期货交易部分主要是与数学有关的应用概率过程,应用概率微分方程式的研究领域,有时被称为数理金融,不论哪个领域,对各种分析对象都需要有与之相应的理论框架。从这种意义说,金融工程还需要经济学,传统的金融理论,金融制度的知识。
1.投资分析
投资分析的目的在于尽可能地提高投资收益,为此从可选择的投资资产中(股票,债权,包括外汇在内的外国证券),进行资产选择操作,在控制风险的同时追求收益的最大化。因此要用到运筹学中的最优化理论。在股价,汇率,利息等金融资产的变动现象大多是多次元的,统计学的方法应用很重要,其要点是:
①大量经过分组的数据;
②反复试验,寻找数据出现的频率。
但股价,汇率等的变动结构,由于追求收益及经济紧缩的变化,在分析期间一般都是不稳定的。
2.风险管理
风险管理的领域正是基于统计学的质量管理的思想建立起来的。企业或银行的财务结构受汇率,利息,股价的变动其资产价值也在不断变化,这就构成了市场风险。为了根据市场风险考察企业资产的价值变化,将企业的价值变化看作风险要素股价,汇率等变化的函数,描述其概率样本分布,推定其下限5%损失可能的金额。其中,即可用有关股价,汇率变化的模型,也可考虑因素相关的变化。最近,最大亏损值的概率分布研究受到关注,其中也在应用极端价格分布理论(extreme
value)。有关银行的不良债权问题经常涉及到的BIS(国际结算银行)规定中,也要求按照上述方法计算企业资产价值变化下限5%的金额,规定企业要保留一定程度的自有资本。从这种意义而言,BIS的规定非常依赖于模型。由于企业资产价值的评估也必须以现价评估,所以不带价格的资产也要依靠模型评估。模型的应用越来越具有现实性,今后会计审计也要求助于统计学的知识。
最近,包括作为价格变动风险的市场风险在内,对信用风险的研究很活跃。其中,不仅是破产风险,由于信用降级变化所引起的债权等的价格变化或信贷利息的变化也成为分析的对象。
上述的投资分析及风险管理的统计性特点可概括为:
第一,将价格,利息等不确定因素数理模型化,这可使用伊藤的概率微分建立微分方程式求解。
第二,上述数理模型是概率随机过程,所以从数学角度作严密论证,且对金融的数理性结构加以数学性的整理(mathematical finance)。这与统计决策论相似。
第三,市场风险与信用风险的预测及管理。预测的结果不仅用来管理市场,而且用于投资的战略选择。为此需要建立数据库,数据取得的时效也变得很重要。这与统计的质量管理有相同点。
3.期货交易
期货交易的领域是理论水平较高并富于挑战性的领域,它包括金融资产组合理论与资产组合的实践(financial
engineering)。许多问题常被从数学角度程序化。其领域的数学结构包括连续时间的马琴戈尔(Martinggales)概率过程,概率微分方程式,概率测度的变换公式,马琴戈尔(Martinggales)的表现定理等。其核心概念为无风险即无收益的所谓的无裁定性理论(nofreGlunch)。期货交易理论以1973年发表的布拉克与舒尔斯(Black=Scholes)的论文与莫顿(Merton)的论文为基础发展起来,以1981年的哈理荪与皮莱斯卡(Harrison=pliska)的概率程序理论得以规范,以1994年的斯卡舍米叶与德巴思(Scachermeiyer=Debbaen)的论文完成了其基础理论。在1997年莫顿(Merton)与舒尔斯(Scholes)获得诺贝尔经济学奖。在此领域中也有实用模型的规范化,假定模型的检验,参数推定等统计问题。
现在金融工程对统计学提出了许多新的问题。大量的数据分析,数据采集挖掘,风险预测及决策分析会成为统计学的新的领域。统计学者观察数据,建立概率统计模型,推导出统计量,求出统计量的概率分布。这些方法应用到金融资产交易的操作中,则构成了金融工程方法论的基础。
四、极值统计学
统计学者中有研究总体中心分布(middle man)与边缘分布(tail
man)这两类研究者。通常,统计学者主要研究母总体分布的中心部分。但极值统计学研究其分布两侧的山脚处(tail),只研究数据分布较少的上位与下位,探讨边缘分布向某点收敛的速度(heavy
tail)。所涉及到的典型问题主要有:例如要建设较强固的防坡堤,为此从可利用的过去百年间的潮位观测数据,推测今后1万年间的最高潮位。还有要建造6米高的防坡堤时,需推测发生超过其高度的大潮的概率,根据其结果决定防坡堤的高度等。此类问题就是使用被给定数据的一部分,预测全体或某范围的数据的最大值。在工程学方面还可举出如下的例子。在水文学中预测今后100年最大的降水量;在腐蚀工程学中机器整体有可能发生的最大腐蚀程度;建筑工程学中的今后50年中的最大的风速,最大的地震强度。在保险学方面有预测发生支付最大的保险金额;环境问题中的污染物质的集中程度;从证券,汇率,利息的时间序列的变化进行分析平均收益及风险的金融工程等等。在欧美日有许多出色的学者在从事这方面的研究。这些问题用统计学的语言表述即为:从未知母总体中抽取部分数据推测其母总体分布非常接近1的概率分位点(quantile)。而要推断这个概率分位点必须进行数据的外插计算,这将是较困难的。为了解决这个问题,在极值统计学中设定了未知母总体分布属于某极值分布的吸引区域。
在20世纪30年代由Fisher与逛皮特(Tippett,1928年)曾对独立同分布概率变量的最大值(极值统计量)的渐近分布(极值分布)进行过理论研究,发现了在极值分布中有逆威布尔分布(Weibull
distribution,逆正态函数分布,常用于拟合机器及系统的寿命分布①),康拜尔分布(Gumbel
distribution,双重指数分布,遵从于同一分布的n个独立连续概率变量中最大值x的极限公布①),及弗来舍分布(Frecher
distribution,连续变量在某点收敛的分布②)这三种等形式,以及观察到了属于正态分布的极值统计量向极值分布的收敛相当缓慢。其后由von
Mises(1936)给出了分布函数属于极值分布吸引区域的充分条件。由此得知统计学教科书中常出现的连续型分布几乎都属于极值分布的吸引区域。比如均匀分布,贝塔分布属于逆威布尔分布的吸引区域;正态分布,威布尔分布,咖码分布,对数正态分布等属于康拜尔分布的吸引区域;而t分布,帕热图分布(Vilfredo Pareto,法国经济学家,提出极限收入分布)等则属于弗来舍分布吸引区域。
50年代极值理论的研究有了很大的进展。通常是选取一年中某时期或某领域的最大值进行研究,将取得的极值数据按照上述三种极值分布模式拟合,推测其参数。但极值数据适合于何种形式的极值分布事先很难确定,因此在1950年以英国的统计学者为主展开了以一种形式表现三种类型极值分布的一般极值分布的数据分析研究。60年代开始了2变量的极值分布研究以及对具有从属性概率过程的极值统计量的渐进分布研究。
但是,从大量数据中仅选用极值会舍弃掉其他数据所具有的有价值的信息。因此,在水文学中出现了不是使用极值而是选取某界限以上的数据分析的方法。此方法称为POT(peaks over
threshold)手法。根据指数分布可近似知道某界限值以上的数据分布。对此加以理论证明的是由巴克曼与哈曼(Balkeman=Haan,1974),还有皮堪德(Pickands,1975)所发现的一般帕热图分布。即分布函数之所以属于一般极值分布(逆威布尔分布,康拜尔分布,弗来舍分布)的吸引区域,就在于分布两侧的山脚部分的数值可用一般帕热图分布(贝塔分布,指数分布,帕热图分布)近似取得。以后,根据一般帕热图分布所进行的数据分析就成为极值理论的主流。在70年代末期至80年代中期,一般多变量极值分布的结构也得以明确。另外,由Galambos(1978,1987)与Leadbetter等(1983)的著作对极值理论的概率论方面作了介绍,理论方面的研究引人注目。
但遗憾的是,由于大多数统计学者的注意力集中在对研究总体中央分布的研究,以及少数统计学者往往侧重在对极值统计学的理论研究,所以极值理论在应用方面的研究还是很不够的。目前以欧美的学者为主组成各个研究小组,正在运用极值理论对水文学,环境保护,自然灾害,异常气象,可靠性工程,保险数学,金融工程等有特色的应用领域展开研究。

加载中…