加载中…
  
博文
分类: 统计
Spss:
在,描述统计中选定 KMO和Bartlett的球形度检验

验证数据是否适合做因子分析

主要参考kmo结果,一般认为大于0.5,即可接受。同时还可以参考相关系数,一般认为分析变量的相关系数多数大于 0.3,则适合做因子分析。

R语言:

http://aoki2.si.gunma-u.ac.jp/R/kmo.html

分类: R
主成分回归主要是克服多重共线性
例子:
考察进口总额Y与3个自变量:国内总产值X1,存储量X2和总消费量X3之间的关系,现收集1949-1959年共11年的数据,试对此做分析。
R程序如下:
#### 用数据框的形式输入数据
conomy<-data.frame(
  x1=c(149.3, 161.2, 171.5, 175.5, 180.8, 190.7, 
       202.1, 212.4, 226.1, 231.9, 239.0),
  x2=c(4.2, 4.1, 3.1, 3.1, 1.1, 2.2, 2.1, 5.6, 5.0, 5.1, 0.7),
  x3=c(108.1, 114.8, 123.2, 126.9, 132.1, 137.7, 
       146.0, 154.1, 162.3, 164.3, 167.6),
  y=c(15.9, 16.4, 19.0, 19.1, 18.8, 20.4, 22.7, 
      26.5, 28.1, 27.6, 26.3)
)
#### 作线性回归
lm.sol<-lm(y~x1+x2+x3, data=conomy)
summary(lm.sol)
标签:

杂谈

分类: SPSS
设某地区的居民收入与初学的历史统计数据如下图:
结果如下图:
http://s15/mw690/8c422ebdzx6CC3lTI4e6e&690
从上图可以看出回归系数是显著地,回归方程也是显著地。
本文的例子摘自 多元统计分析 (何晓群)
研究城镇居民的消费结构,需将相关性强的指标归并在一起,这是对变量进行聚类。
数据:
3-5

  


SPSS的显示分为标题、页面标题、文本输出、表格四部分。不同部分出现中文乱码的情况要去设置相应的部分。
 标题、页面标题、文本输出的设置如下。
菜单栏中“编辑”→“选项”→“查看器”选项卡→标题、页面标题、文本输出操作面板,改动字体即可。根据网络搜索得到的信息,改
标签:

杂谈

分类: 统计
1.增减样本量或者删除奇异点。
2.更换样本部分数据或修匀样本数据:
3.改变模型形式。
4.增加模型中的解释变量。
5.减小残差。

分类: EXCEL
采用基于信息论的ID3决策树分类算法进行客户忠诚度分析
 顾客忠诚度指顾客忠诚的程度,是一个量化概念。顾客忠诚度是指由于质量价格服务
分类: SAS
此文仅记录不熟悉的
** 乘方
^= 不等号
IN 等于列表中的一个
缺失值参加比较,它比任何有效值都小。
& 与
| 或
^ 非
>< 取最小
<> 取最大
|| 连接

分类: SAS
proc means mean std max min maxdec=3;
by group;
var x;
run;
'maxdec=3'表示打印结果的最大小数位数是3.缺省值为2.
proc means noprint;
表示不显示“means过程输出结果”。
meanx=10**(meany)
'**'表示乘方

分类: SAS
例1:产生1000个服从参数为a,b的均匀分布 U(a,b).
data w1;
do i=1 to 1000;
x=rand('uniform');
y=(b-a)*x+a;
output;
end;
exponential 产生标准E(1)分布的随机数据。
产生1000个服从正态分布的随机数据。
data w2;
do i=1 to 1000;
x=rand('normal',均值,标准差);
output;
end;
参考网址:
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有