【原创】MATLAB舍入误差和IEEE754标准深入分析
(2009-09-19 11:56:11)
标签:
舍入误差matlabieee技术论坛实数精度杂谈 |
分类: MATLAB |
本帖由MATLAB技术论坛原创,原帖参见http://www.matlabsky.com/viewthread.php?tid=3093
该教程详细介绍了MATLAB的舍入误差原理和计算,并给出实例验证。
由于涉及很多数学公式和图形,帖中不方便展示,下面给出了大概的内容提要,具体参见本帖pdf附件http://www.matlabsky.com/viewthread.php?tid=3093!
舍入误差是计算机进行实数计算是所产生的。之所以产生舍入误差是因为机器中进行的算术运算所涉及的数是有限位的,从而导致计算只能用实际数值的近视表示式来完成。在典型的计算机中,仅实数系统的一个相对小的子集用来表示所有的实数。这个子集包含了正负有理数,且存储了小数和指数部分。
IEEE754-1985二进制浮点运算标准
MATLAB中所有数值都是使用64bit表示的。根据754-1985规定,第一位是符号指示位(S),接下来的11位是指数部分(C),最后称为尾数的52位为小数部分(F),指数的基是2。
X64表示的区间范围
x64=0 10000000011 1011100100010000000000000000000000000000000000000000
y64=0 10000000011 1011100100001111111111111111111111111111111111111111
z64=0 10000000011 1011100100010000000000000000000000000000000000000001
这意味着,二进制机器数x64不仅仅代表十进制的x,还表示x临域内的所有实数,也就是说十进制区间(注意是左闭右开的区间)
[(y+x)/2, (x+z)/2)=
[15518507114430463/562949953421312, 15518507114430465/562949953421312)
内所有数据都是使用机器数x64表示的。这样机器的截断误差就出现了!
如何确定XMIN和XMAX
从IEEE754-1985的规定,我们容易知道64位机器数能够表示的最小正数,此时第64位为1其它为0,故
xmin=2^(-1023)*(1+0.5^52)≈10^(-308)
在计算小于xmin的数据的时候,MATLAB直接当0处理
同理最大的正数则第1位为0其它为1,故
xmax=2^1024*(2-0.5^52)≈10^308
在计算大于xmax数据时,MATLAB视为Inf
X的精度范围求解
二进制数x64的前后一个数,相当于在x64尾数的最后一位加1或减1,故x64与最近的数之间的距离为0.5^52 ,另外指数位会将尾数放大了2^n倍,故最终x的精度为0.5*2^(n-52)(注意必须乘以0.5,原因如上)。故在±0.5*2^(n-52)范围内的数据,MATLAB都用x64表示,也就是认为都是x
舍入误差是计算机进行实数计算是所产生的。之所以产生舍入误差是因为机器中进行的算术运算所涉及的数是有限位的,从而导致计算只能用实际数值的近视表示式来完成。在典型的计算机中,仅实数系统的一个相对小的子集用来表示所有的实数。这个子集包含了正负有理数,且存储了小数和指数部分。
IEEE754-1985二进制浮点运算标准
MATLAB中所有数值都是使用64bit表示的。根据754-1985规定,第一位是符号指示位(S),接下来的11位是指数部分(C),最后称为尾数的52位为小数部分(F),指数的基是2。
X64表示的区间范围
x64=0 10000000011 101110010001000000000000
y64=0 10000000011 101110010000111111111111
z64=0 10000000011 101110010001000000000000
这意味着,二进制机器数x64不仅仅代表十进制的x,还表示x临域内的所有实数,也就是说十进制区间(注意是左闭右开的区间)
[(y+x)/2, (x+z)/2)=
[15518507114430463/562949953421312, 15518507114430465/562949953421312)
内所有数据都是使用机器数x64表示的。这样机器的截断误差就出现了!
如何确定XMIN和XMAX
从IEEE754-1985的规定,我们容易知道64位机器数能够表示的最小正数,此时第64位为1其它为0,故
xmin=2^(-1023)*(1+0.5^52)≈10^(-308)
在计算小于xmin的数据的时候,MATLAB直接当0处理
同理最大的正数则第1位为0其它为1,故
xmax=2^1024*(2-0.5^52)≈10^308
在计算大于xmax数据时,MATLAB视为Inf
X的精度范围求解
二进制数x64的前后一个数,相当于在x64尾数的最后一位加1或减1,故x64与最近的数之间的距离为0.5^52 ,另外指数位会将尾数放大了2^n倍,故最终x的精度为0.5*2^(n-52)(注意必须乘以0.5,原因如上)。故在±0.5*2^(n-52)范围内的数据,MATLAB都用x64表示,也就是认为都是x
后一篇:矩阵求导,矩阵计算