加载中…
正文 字体大小:

第一篇:如何合并spss文件

(2010-10-13 16:46:25)
标签:

学习篇

教育

分类: 学习篇

 

因为需要,刚在网上找到了,已经把自己需要用的部分学会了,希望以后可以鼓励自己继续好好学习

 

SPSS合并数据文件

合并数据文件

1.合并数据方式

合并数据文件是指将外部数据中的观测量或者变量合并到当前数据文件中去,它包括两种合并方式。

(1)从外部数据文件增加观测量到当前数据文件中。这种方法称为纵向合并或追加观测量。相互合并的数据文件中应该有相同的变量不同的观测量。从外部数据文件增加观测量到当前数据文件中后,将生成新的数据文件。

(2)从外部数据文件增加变量到当前数据文件中。称为横向合并。相互合并的数据文件中包含不同的变量。

2.增加观测量(Add Cases

(1)首先在数据窗中打开一个数据文件data05-03,如图5-12a所示。

(2)Data-Merge Files-Add Cases顺序逐一单击鼠标键,打开Add Cases: Read File对话框,询问确定增加观测量的外部数据文件。指定一个SPSS数据文件,文件扩展名为*.SAV,这里打开data05-04数据文件,如图5-12b所示。

观察这两个数据文件它们都具有一些相同的变量名称id, sex, age.

其操作与打开数据文件的操作相同。指定数据文件的操作完成后单击Continue按钮。展开Add Cases From对话框。如图5-13所示。

 

 

5-12两个数据文件的原始状态

(3)对话框中右侧Variables in New Working Data File框中列出的变量是在两个数据文件中文件名相同、类型相同的变量(id, sex, age)。这些变量直接包括在合并后的新文件中。

左侧的Unpaired Variables框中列出的变量是未配对变量。即或存在于当前工作数据文件中的height变量和存在于指定的外部数据文件中的weight变量。这些变量在另一个数据文件中找不到与之名字相同的变量,或虽然名字相同但类型不同。即它们不能配对,在合并后的新文件中并为一个变量。

其中标有“*”的是当前工作数据文件(以下简称工作文件)中的变量;

 

标有“+”的是外部数据文件(以下简称外部文件)中的变量。

(4)根据情况处理数据

①只合并两个数据文件中具有相同名称的变量的观测量时,只需单击OK按钮。

②追加合并外部数据文件中名称不同的变量(不匹配变量)的观测量。此时需要首先

Add Cases From对话框中的Unpaired Variables框中设置配对变量,即用鼠标先选取一个变量,然后按住Ctrl键的同时选取另外一个配对变量,然后单击Pair按钮将它们作为一个配对变量选入新的数据文件中,单击OK按钮。

此时SPSS系统对观测量数据的追加应遵循以下凡个方面的原则:

.在两个数据文件不同名变量的观测量,可以把它们配对为相互匹配的变量,并且将

它们选入新的数据文件中。

.一个数据文件中被设置为数值型变量的观测量,不能与其他文件被设置为字符串型

变量的观测量进行追加合并_。

.不同宽度的字符串变量,必须首先将它们的宽度设置一致后才能进行观测量的合并,

否则有可能观测量丢失。

.如果强行将不匹配的变量选入新的数据文件中,有可能造成观测量数据的遗失。

例如:如图5-12所示的当前工作数据文件中的变量Height与外部文件数据文件中的变量h均保存了身高数据。只是变量名称不同。在未配对变量表中选择这两个变量,单击Pair按钮。在新工作数据文件的变量表中显示“heighth”。单击OK按钮两个数据文件合并结果如图5-14a所示。

未配对变量表中的变量在配对时要求一定要具有相同的变量类型。宽度不一定相同时,

当前文件中的变量宽度应当大于等于外部文件变量的宽度(height的宽度大于h的宽度)。如果但是当前文件中的变量宽度小于外部文件变量的数据的宽度(height的宽度大于h的宽度),在合并后外部文件被合并的观测量中的相应变量数据会丢失。在变量值丢失的单元处显示若干个星号“*”

如果不进行配对并移入新数据文件变量栏内,虽然它们包含的信息是相的,则在新数据文件中将不包括这两个变量。

对于只在一个数据文件中含有的变量(例如变量w仅在外部文件中存在),如果不想进行变量的配对,将它移入新的数据文件中,只要在未配对变量表中选择这个变量后,单击向右箭头按钮,将其移入新数据文件变量表中即可。图15-4b是将变量w移入新数据文件变量表中,对身高变量heighth没有进行配对并移入新数据文件变量表中,执行合并的结果。由于当前工作数据文件不包括变量w,因此相应的观测量w值为缺失值。

 

 

5-14不同变量情况的观测量合并

(5)易吐除合并的变量

为了从新合并的数据文件中剔除一个变量,在Variables in New Working Data File框中选择一个变量单击向左箭头按钮即可。

(6)为变量改名

为变量改名的作用主要是为了匹配变量创造条件。对于Unpaired Variables框中的变量,在将变量选入Variables in New Working Data File框中之前,可以修改它们的变量名。只要用鼠标选择待改名的变量,单击Rename按钮,展开Rename对话框,在 New Name框中输入该变量的新名,然后单击Continue按钮返回主对话框即可。

完成更名后的变量如果与其他数据文件中的变量同名且同类型,一定要按下Pair按钮才能将它们选入新的数据文件中。

Variables in New Working Data File框中的变量是不能改名的。必须把需要改名的变量选入Unpaired Variables框中,按下Rename按钮,在Rename对话框中完成改名,单击Continue按钮继续。返回主对话框。必要时再将其移入Variables in New Working Data File框中。

(7)生成表明观测量来源的新变量

选中Indicate case source as variable数据来源变量复选项,将生成一个新的变量加入到新的数据文件中。其变量值0表示观测量来自工作文件,1表示观测量来自外部数据文件。

3.增加变量(Add Variables)增加变量有两种方式:

(1)从一个指定的外部数据文件中取得一个或几个变量的数据(包括变量名称)增加到当前工作数据文件中,实际上相当于两个数据文件的横向合并。

(2)按关键变量合并,即要求两个数据文件必须有一个共同的关键变量。而且这两个文件中的关键变量还存在一定数量的相同值的观测量。例如,同一个班的学生的身高、体重变量分别在两个数据文件中。两个数据文件有表明学号的变量id.当前工作数据文件中包括变量id和身高变量h,外部数据文件包括变量id和体重变量wo要想把变量w的一系列值加入到当前工作文件中,必须把一个学生(id值相同)的体重值合并到与之具有相同学号的观测量中去。变量id即为关键变量。

为了说明具体的操作步骤,以data05-03为当前工作数据文件,以data05-04为外部数据文件。

(1)Data-Merge Files-Add Variables顺序逐一单击鼠标键,打开Add Variables: ReadFile对话框。此对话框要求指定外部数据文件。该外部文件中包括有待加入到当前工作数据文件中的变量。

(2)指定外部数据文件的操作与打开一个数据文件的操作完全相同。指定C:\spssdata\data05-04.sav为包含待加入变量的文件。然后按Continue按钮。展开Add Variablesfrom对话框,如图5-巧所示。

对话框右侧New Working Data File新工作数据文件矩形框中,列出的变量是可以在新工作数据文件中存在的变量。左侧Exclude Variables框中列出的两个文件中重复的同名变量。只有这样的变量可以作为关键变量,关键变量的值是否相等,决定是否合并两个文件中的观测量。

在两个矩形框中标有“*”的是当前工作数据文件中的变量,标有“+”的是外部数据文件中的变量。

所有包含在Exclude Variables框中的变量都是外部数据文件中与当前数据文件中同名的变量,并且外部数据文件中的同名变量都不能进入合并后新生成的的数据文件中。

(3)根据情况处理数据

①此时如果不指定关键变量,想把外部数据文件中所选定的变量直接与当前数据文件的变量合并到新的数据文件中去,此时单击OK按钮即可开始横向合并两个数据文件了。

注意:如果两个数据文件中具有同名的变量,那么合并的结果是保留当前数据文件中同名的变量加上外部数据文件中不同名的变量,也就是说与当前数据文件中同名的变量将被排除在合并后的新建文件之外。

②如果在当前数据文件与外部数据文件中包含相同变量时,可以选择按指定的关键变量进行合并。首先需要在合并之前对数据文件进行按关键变量值的升序排序工作。然后选中Match cases on key variables in sorted files复选项,在以下3个选项中选择其一。

Both files provide cases选项,即观测量由两个数据文件提供。此选择项要求两个数据

文件中关键变量的值具有唯一性。合并的结果实际是按照关键变量的顺序,将外部数据文件与当前数据文件不同名的变量进行纵向累加,外部数据文件中的同名变量被作为遗失值处理。如图5-16所示。

 

5-15从外部数据文件增加变量对话框

 

5-16合并后的新数据文件

观察图5-16所示的文件合并后,被作为缺失值处理的变量以及观测量排序的情况,由于选择id变量进入Key Variables框中,文件中的观测量按id变量的升序排列。

如果关键变量中存在相同的值,那么关键变量值相等的观测量将合并为一个观测量,

5-17a为当前数据文件<data05-05),图5-17b为外部数据文件(data05-06 ),图5-17c为合并后的新数据文件。

 

5-17由两个排序数据文件提供合并数据

External file is keyed table选项,即保持当前数据文件中的观测量数目不变。在外部数

据文件中,只有那些与当前数据文件中关键变量等值的观测量才能合并到新的工作数据文件中,如data05-05data05-06数据文件以这种方式合并,结果见图5-18a所示。

Wg不种ng Data File is keyed table选项,当前数据文件中的观测量按与外部文件中的关

键变量值相等时并入外部文件,如data05-05data05-06数据文件以这种方式合并,结果见图5-18bo

 

 

5-18以关键变量值相等原则合并

以上3种情况均为两个数据文件虽然有共同的关键变量,但排序后并无一一对应的关

系的情况下选用。

最后将在Excluded Variables框中的选择的关键变量(id),通过单击下面一个向右箭头按钮移到Key Variables框中。

(4)单击OK按钮将指定条件和方式的合并提交系统执行。系统将提示警告:如果两个文件没有按关键变量排序,合并可能失败。如果在指定文件前,若有一个数据文件没有排序,则应该单击Cancel按钮,对数据文件排序后重复上述操作再提交系统进行合并。

(5)几点说明

①如果在当前数据文件中与外部数据文件中有同名的变量,外部数据文件中的变量列于Exclude Variables框中;当前数据文件中的变量列于右面的New Working Data File框中。

Exclude Variable框中的变量若选作关键变量,则可以通过向右箭头按钮移到孙yVariables框中。与其同名的New Working Data File框中的变量消失。

③如果一定要将Exclude Variables框中外部数据的同多变量合并到新的数据文件中去,那么首先应为该变量更名,即单击Rename按钮。在被打开的相应的对话框中赋予该变量一个新名。然后选择该变量,并单击上面一个向右箭头按钮将其移到New Working DataFile框中。

如果不要它作为新数据文件中的变量,则可让它留在Exclude Variables框中。

New Working Data File框中的变量均为新数据文件中的变量。如果不想使某变量出现在框中,则选择这个变量,单击上面一个箭头按钮(此时自动变成向左箭头),将其移到Exclude Variables框中。

(6)为变量更名。在将变量选入合并数据文件中之前,有以下的原因为变量更名。

①如果选择来自外部数据文件与当前数据文件中变量同名的变量进入新生成的数据文件中去,但却带有不同的数据。

②想选择的关键变量在两个文件中的名称不同。③不喜欢变量的名称。

首先将变量选入Excluded Variables框中:选择要更名的变量后单击Rename按钮即可更名。

(7)生成新变量

如果选中Indicate case source as variable复选项,即显示数据来源变量,一个新的变量(用户输入的变量名称)将会加入到当前数据文件中。其变量值0表示观测量来自当前数据文件,1表示观测量来自外部数据文件。

 

0

阅读 评论 收藏 转载 喜欢 打印举报
已投稿到:
  • 评论加载中,请稍候...
发评论

       

    验证码: 请点击后输入验证码 收听验证码

    发评论

    以上网友发言只代表其个人观点,不代表新浪网的观点或立场。

      

    新浪BLOG意见反馈留言板 不良信息反馈 电话:4006900000 提示音后按1键(按当地市话标准计费) 欢迎批评指正

    新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 会员注册 | 产品答疑

    新浪公司 版权所有