标签:
知识/探索 |
大学时,没有怎么学过线性代数,也不知道什么是矩阵,直到07年暑假,通过上谢宇的“应用线性回归”课程,才对矩阵有所了解了。统计学与数学不一样,我们这些学统计学的没有必要具有精通的数学知识,但是没有一点数学基础也是不行的,毕竟统计学就是用“数字说话的”。
多元统计分析方法所用到的数学知识主要是矩阵,其实只要会一些基本的矩阵运算就足以应付多元统计分析方法了,但是如果你的矩阵代数学的好的话,那学多元统计分析方法就会更顺利了。在多元统计方法中,涉及到的矩阵知识主要有以下几个方面:
1.数据矩阵
这是一个n*p矩阵,行对应于与实验单位或观察单位,列对应于所测量的变量。
2.数据向量(data vectors)
在数据矩阵X中的每一行被称作行向量(row vectors)
当数据矩阵X的第r行数据写出列向量(columm vectors)的时候:
可以看出,行向量是列向量的转置矩阵
因此,数据矩阵X也可以用行向量表示:
在统计学中,一般用i j k 标注变量,用
r s t 标注实验单位或观察单位。
3.期望值向量(mean vectors)
一般而言,随机变量X的期望值向量如下表示:
4.方差-协方差矩阵
随机变量X的方差-协方差矩阵如下表示:
几乎所有的多元方法都依靠于方差-协方差矩阵元素的函数,最重要的函数是它的行列式、特征值、特征向量等。
特征值一般描述了数据所落入的空间的形态,而特征向量则显示了 the
direction of major and minor axes that can be associated with the
data points.
前一篇:多元统计分析的本质就是简化
后一篇:主成分分析之我见<br>