海森矩阵

标签:
正定海森矩阵杂谈 |
分类: 算法 |
海森矩阵
在数学中,海森矩阵(Hessian
matrix
如果
其中
(也有人把海森定义为以上矩阵的行列式) 海森矩阵被应用于牛顿法解决的大规模优化问题。
[编辑]混合偏导数和海森矩阵的对称性
海森矩阵的混合偏导数是海森矩阵非主对角线上的元素。假如他们是连续的,那么求导顺序没有区别,即
上式也可写为
在正式写法中,如果
[编辑]在 http://upload.wikimedia.org/math/1/3/4/134676911181af05d24d406f16edf587.png 的函数的应用
给定二阶导数连续的函数http://upload.wikimedia.org/math/8/f/a/8fa14cdd754f91cc6554c9e71929cce7.png
对于
- H > 0 :若http://upload.wikimedia.org/math/f/c/6/fc6c713e7eb34f6cb756d754fc2f61db.png是局部极大点。
- H < 0 :http://upload.wikimedia.org/math/f/c/6/fc6c713e7eb34f6cb756d754fc2f61db.png是鞍点。
- H = 0 :二阶导数无法判断该临界点的性质,得从更高阶的导数以泰勒公式考虑。
[编辑]在高维情况下的推广
当函数http://upload.wikimedia.org/math/6/0/7/607acaa73c762411b20745149a11e90b.png阶的对称矩阵。
- 当H是正定矩阵时,临界点http://upload.wikimedia.org/math/0/b/2/0b21a666a81629962ade8afd967826ed.png是一个局部的最小值。
- 当H是负定矩阵时,临界点http://upload.wikimedia.org/math/0/b/2/0b21a666a81629962ade8afd967826ed.png是一个局部的最大值。
- H=0,需要更高阶的导数来帮助判断。
- 在其余情况下,临界点http://upload.wikimedia.org/math/0/b/2/0b21a666a81629962ade8afd967826ed.png不是局部极值。