spss教程:常量、变量和表达式(2)
(2009-08-02 21:59:59)
标签:
杂谈 |
分类: spss统计实务技巧 |
SPSS统计事务所主要业务:
1.为学生毕业论文、公司、高校课题提供spss、LISREL、Amos等数据分析服务。
2.为公司、高校和科研机构提供价格优惠的调查问卷数据录入服务。
3.为课题提供量化统计指导和咨询。
联系方式:
QQ:3098529344
电话:18375425162
公司地址:山东省青岛市白沙河街道办事处256号
4.6 构建新变量
在进行数据的分析处理时往往仅根据原始测量的变量值是不够的,常常需要根据已经存在的变量建立新变量。例如需要将出生年月与调查时点相减,计算调查时年龄;根据家庭男性人数、家庭女性人数,计算家庭总人数等。这些工作可以直接由SPSS语句实现。对SPSS来说,体现其特点的更直观方法是通过Compute对话框完成。使用Compute对话框完成建立新变量的方法与步骤是
2.在目标变量(Target Variable)框中输入一个目标变量的名称,用来接收计算的值。这目标变量的名称可以是一个新的变量名称或是一个定义过的变量名称。在数学表达式(Numeric Expression)框中输入合理的组合表达式。
利用计算关系板(Calculator Pad)在Numeric Expression下面的矩形显示框中输入计算新变量值的数学表达式。计算关系板中包含了常数、数学操作符、关系表达符号、逻辑操作符等27个键符,也可以用计算机的键盘取而代之。另外,在矩形显示框中的变量名最好从左下方的源变量中选择适当变量,再单击右箭头按钮,使选中的变量名出现在表达式矩形框中,同时在计算关系板(操作板)或键盘上选择数字或操作符。选中的操作符或数字按选中的先后顺序出现在表达式框中。也可在移动函数库边滚动条查找所需的函数,双击选中的函数;或单击选中的函数,然后单击向上箭头按钮,使选中的函数出现在表达式中。注意所有的计算符号必须是半角状态中的英文形式,建议使用原有函数。
SPSS函数库共收集有10类139种函数,其中包括日期和时间函数(占函数总数的20.6%)、累计分布函数(19.8%)、随机数产生函数(17.5%)、字符串函数(14.3%)、逆分布函数(11.9%)、算术函数(9.5%)、统计函数(7.9%)、缺失值定义函数(3.2%)、逻辑函数(1.6%)、和“数值与字符相
互转换函数”(1.6%)。但经常用的也就算术函数、统计函数、缺失值定义函数、逻辑函数等4类10来个函数。注意SPSS是对整列全部样本进行运算的,如rnd(VAR1)就是对VAR1变量的所有样本,无论是10还是2万,全部进行四舍五入处理。如果对部分样本进行处理,则需先用“选择”样本,以删除不相干数据。
表4.6 常用变量函数
|
Abs |
取绝对值 |
Exp |
取e的指数 |
normal() |
产生正态分布随机变数 |
|
Rnd |
四舍五入 |
lg10 |
常用对数 |
uniform() |
产生均匀分布随机变数 |
|
trunc |
截尾取整 |
Ln |
自然对数 |
Number() |
字符串转数字变量 |
|
Sqrt |
取平方根 |
Sin |
正弦函数 |
String() |
数字变量转成字符串 |
当计算的新变量适应于部分样本时,或当不同特点的样本使用不同的表达式时,或新变量的值需要分步进行计算,就要用对话框右下方if条件表达式选择合适的样本。对条件表达式为真的观测量使用Compute Variable对话框中确定的表达式计算新变量的值,而对那些使条件表达式为假或缺失的观测量,保留原值而不赋予新变量的值。
先在Compute Variab1e对话框中单击下if按钮,打开条件表达式窗口(图5.12);根据需要选择下列两项之一:
①Include all cases包括所有观测量,这是默认选项。即对所有观测量使用主对话框中的计算表达式计算新变量的值。
②Include if case satisfy condition只对满足条件表达式的样本计算新变量的值。若选择了此项,就激活其下面的矩形框,可以利用其下关系表达式或键盘,在矩形框中输入条件表达式。条件表达式至少要包括一个关系操作符;且通过关系操作符可以连接多个条件表达式;每一个关系表达式必须单独完成,例:age>=15 &age<=49合法,而age>=15&<=49为非法;“.”是表达式中唯一合法的小数说明符号。
例age>=15表示只有age大于等于15的样本才会被选择; Salary<500 & jobcat=5表示只有Salary小于500并且jobcat变量值等于5的样本才会被选择。如果选择16-59岁男性(sex=1)人口以及16-54岁女性人口,该表达式为:
age>=16 & age <=59 & sex=1 | age>=16 & age <=54 & sex=2
为计算一个新变量赋予一个类型与标签说明,在目标变量下方单击Type & Label按钮,就可打开变量类型与标签对话框,直接定义新变量的标签label(<120个字符)和变量类型Type,默认设置是数值型Numeric,宽度width为8。为说明函数的使用,特举如下一例。用随机变数发生器UNIFORM建立200个男女学生模拟的出生年月及各门课程的成绩,计算各同学的年龄(注意仅能在英文状态下输入)。
① 在第一个变量第200个样本处任意输入一数据,比如50;
②假定每个学生都出生在1975-1985年,则输入模拟值
year=RND(1975+UNIFORM(10))
③输入20人出生月份模拟值
month=RND(1+UNIFORM(11))
④输入各人性别变量的模拟值
sex= RND(1+UNIFORM(1))
⑤假定2000年11月1日进行调查,计算每人年龄为
图4.20 目标变量的选择、计算对话框图
AGE=2000-YEAR (IF MONTH<=10)
AGE=2000-1-YEAR (IF MONTH>10)
即出生月份在10月以前,年龄为200011生年,若出生月份在11月以后,年龄为1999-出生年。
⑥设置本人各门功课的成绩,假定每人各门课成绩为55分以上,100分以下,呈均匀分布:
MATH=RND(55+UNIFORM(45))
ENGLISH=RND(55+UNIFORM(45))
CHINESE=RND(55+UNIFORM(45))
⑦最后将第一列删除(整个表格如下)。
图4.21 模拟的学生各门学科的成绩

加载中…