加载中…
个人资料
MinitabUsersGroup
MinitabUsersGroup
  • 博客等级:
  • 博客积分:0
  • 博客访问:6,490
  • 关注人气:25
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

使用Box-Cox转换的益处

(2015-05-15 17:25:32)
标签:

杂谈

     想象一下,你正在观看长跑比赛,注视着终点线。当第一人跑完全程时,跑得最快的几个人之间相差的时间很短。

     现在等到最后一名跑到终点,我们考虑一下他们的完成时间。对于这些速度最慢的跑步者,跑步完成时间差异将非常大。这是因为在长跑中,很小的速度差将会对完成时间产生显著影响。而对于跑的最快的人,速度的微小差异(决定性)影响到最终到达终点的时间。

     这种现象被称为异方差性(不恒定方差)。在这个例子中,变异量取决于平均值(差异小完成时间短,差异大完成时间长)

http://tc/maxwidth.2048/tc.service.weibo.com/p/mmbiz_qlogo_cn/9c40c74536c18695249db1d647da175b.jpg

     跑步时间的数据分布可能不服从我们熟悉的钟形曲线(又名正态分布)。结果得到的分布是不对称的右侧长尾分布。这是因为跑步时间短的呈现出左侧变化较小的短尾分布,跑步时间长的呈现出右侧变异大的长尾分布。

http://tc/maxwidth.2048/tc.service.weibo.com/p/mmbiz_qlogo_cn/d751f9573c14e6cac948df4c05df4d63.jpg
为什么是这样呢?

1.模型偏倚和伪交互作用:如果您正在进行回归分析或实验设计(任何统计模型),这种不对称分布可能会导致模型扭曲。如果一个因子对平均速度有显著影响,这意味着对于一个较大的平均跑步时间来说该因子的差异更大。当均值较大时,许多因子似乎都有更强的影响。然而,这并不是真正的因子产生的影响,而是当均值较大时,变异的增加导致所有因子效应估计变大。这可能会产生虚假的交互作用,由于不恒定的变化产生一个具有许多(虚假的、不现实的)交互的、非常复杂的模型。

2.如果你执行一个标准的过程能力分析,这种分析是基于正态分布的假设。过度偏离正态分布会使你的能力估计产生偏差。

Box-Cox 转换

     解决这个问题的一个方法是使用Box-Cox转换将数据转换为正态,Minitab软件会选择最好的数学函数进行数据转换。目的是得到正态分布的数据(转换后)和稳定的方差。

考虑下面的不对称函数:

http://tc/maxwidth.2048/tc.service.weibo.com/p/mmbiz_qlogo_cn/8f2a453ddfd27e77d5da65978850cfdb.jpg
http://tc/maxwidth.2048/tc.service.weibo.com/p/mmbiz_qlogo_cn/d10254209932f063f0c1dd6504535102.jpg

     如果对这个分布进行对数变换,较小数据之间的差异将会变大(因为对数函数的斜率很小),而较大数据之间的差异将减少(因为该分布中较大数据的斜率很小)。如果你拓展了左尾的差异,减少了右尾的差异,结果将是方差恒定、形状对称的正态分布(无论均值大小如何)。这就是为何在Minitab协助中无论对于什么样的数据通常都建议使用Box-Cox转换,,以及为何在Minitab软件的回归分析或DOE(试验设计)的对话框中,Box-Cox转换是其中一个选项,,无论哪种情况都可以考虑是否需要将数据转换成正态。

http://tc/maxwidth.2048/tc.service.weibo.com/p/mmbiz_qlogo_cn/bb8ee883207a597c0522c9c6bb2721cb.jpg

     上面的图形说明通过 Minitab软件协助(能力分析)中的Box-Cox转换,不对称分布的数据已经转换成了一个对称的正态分布(成功地通过了正态性验证)

Box-Cox转换和变量

     注意,Minitab软件将使用最佳的变换函数,它不一定是对数转换。

     通过这个转换,原来的变量尺度可能发生了改变,在查看过程能力图形时,可能无法识别典型数据(转换后)的大小。然而基于正态分布估计的PpkPp等能力指数将是可靠的。同样,尽管转换明显有助于消除虚假的交互并识别非常重要的因子,但您需要注意在回归模型中其系数将被修改。

http://tc/maxwidth.2048/tc.service.weibo.com/p/mmbiz_qlogo_cn/edf9928bb69b42c4d2821d1aca51ab68.jpg

关注Minitab公众微信号请扫下面二维码        

或搜索minitabchina加关注

http://tc/maxwidth.2048/tc.service.weibo.com/p/mmbiz_qlogo_cn/7732971a6e6e0ae650236aca82118e73.jpg                                      

http://tc/maxwidth.2048/tc.service.weibo.com/p/mmbiz_qlogo_cn/2913f590869e109a14d872dff02d86a0.jpg Minitab 官方微博:http://weibo.com/minitabchina

电话:021-32586732


0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有