加载中…
个人资料
daisycolour
daisycolour
  • 博客等级:
  • 博客积分:0
  • 博客访问:3,369
  • 关注人气:48
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

正态分布/高斯分布概念

(2019-09-19 15:16:05)
标签:

高斯分布

概念

参数

求解

分类: Concept

参考:

https://baijiahao.baidu.com/s?id=1621087027738177317&wfr=spider&for=pc

https://baike.baidu.com/item/正态分布/829892?fr=aladdin


一. 正态分布(Normal distribution),

也称“常态分布”,又名高斯分布(Gaussian distribution), 最早由A.棣莫弗在求二项分布的渐近公式中得到。 C.F.高斯在研究测量误差时从另一个角度导出了它。P.S.拉普拉斯和高斯研究了它的性质。

是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。

若随机变量X服从一个数学期望为μ、方差为σ^2的正态分布,记为N(μ,σ^2)。

其概率密度函数为正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。

当μ = 0,σ = 1时的正态分布是标准正态分布。


二. 形状

正态曲线呈钟型,两头低,中间高,左右对称因其曲线呈钟形,因此人们又经常称之为钟形曲线。

关于μ对称,并在μ处取最大值,在正(负)无穷远处取值为0,在μ±σ处有拐点,


三. 重要量的性质

1.密度函数关于平均值对称

2.平均值是它的众数(statistical mode)以及中位数(median)

3.函数曲线下68.268949%的面积在平均值左右的一个标准差范围内

4.95.449974%的面积在平均值左右两个标准差2σ的范围内

5.99.730020%的面积在平均值左右三个标准差3σ的范围

其中第3-5条称为68-95-99.7法则


四. 图形特征

集中性:正态曲线的高峰位于正中央,即均数所在的位置。

对称性:正态曲线以均数为中心,左右对称,曲线两端永远不与横轴相交。

均匀变动性:正态曲线由均数所在处开始,分别向左右两侧逐渐均匀下降。

曲线与横轴间的面积总等于1,相当于概率密度函数的函数从正无穷到负无穷积分的概率为1。即频率的总和为100%。


五. 模型参数求解

https://blog.csdn.net/wang2011210219/article/details/81568216

数据满足高斯分布,即图1

正态分布/高斯分布概念

然后我们建立最大似然函数:图2

正态分布/高斯分布概念

然后我们要求解高斯分布实际上就是使得该最大似然函数取得最大值的过程。求解使该函数取得最大值的求解步骤:

1、对该似然函数取对数;

2、对μ和σ求偏导,使导数为0;

经过上面两步解出:图3,图4

正态分布/高斯分布概念

正态分布/高斯分布概念

这里的n和xi都可以从数据集中获取,求解即可。


六. 参数含义

https://blog.csdn.net/qinze5857/article/details/80094921

(1)μ是正态分布的位置参数,描述正态分布的集中趋势位置。

正态分布以x = μ 为对称轴,左右完全对称。正态分布的均数、中位数、众数相同,均等于μ .

(2) σ描述正态分布资料数据分布的离散程度,σ越大,数据分布越分散,σ越小,数据分布越集中。

σ也称为是正态分布的形状参数,σ越大,曲线越扁平,反之,σ越小,曲线越瘦高。

正态曲线下面积的分布规律:如果用其标准差作为衡量单位,则以均数为中心,

正负1个标准差内,即(μ-σ,μ+σ)区间内,正态分布曲线下的面积为总面积的68.27%;

正负2个标准差内,即(μ-2σ,μ+2σ)区间内,面积为95.44%;

正负3个标准差,即(μ-3σ,μ+3σ)区间内,面积为99.74%.这是由正态分布的性质所决定的。

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有