关联分析的数据处理操作(spss18及clementin12操作)

标签:
关联分析spss数据分析师认证数据分析数据挖掘 |
关联分析的数据处理操作(spss18及clementin12操作)
什么是关联分析
关联分析是指如果两个或多个事物之间存在一定的关联,那么其中一个事物就能通过其他事物进行预测.它的目的是为了挖掘隐藏在数据间的相互关系
,在数据挖掘的基本任务中关联(association)和顺序序贯模型(sequencing)关联分析是指搜索事务数据库
(trarisactional
databases)中的所有细节或事务,从中寻找重复出现概率很高的模式或规则。其属于灰色理论中的一种分析方法。
方法一:
我们在做关联分析时常常看到的原始数据是这样的(用户的唯一标示、购买的产品):
关联分析则是需要这样的数据格式:
即:UID为101的用户,购买了a、b、c,UID为102的用户购买a,1代表购买,0代表未买
下来我们用spss18来进行数据转换操作:
第一步,在数据选项中选择重组,在填出的窗口上点击确定(对原始数据备份)
http://www.cda.cn/uploadfile/image/20160211/20160211100650_44064.png
第三步:选择标示变量UID及索引变量(购买产品),点击下一步
第二步,选择第二个选项,然后点击下一步
第四步,选择第一个选项并点击下一步
第五步,选择按初始变量排序组合,创建指示符变量
直接点击完成,数据转化完成!!!
方法二,利用spss中的syntax来完成:
首先在文件选项中点击新建并选择语法,直接复制以下syntax,并运行即可:
SORT CASES BY UID
SORC.
CASESTOVARS
/ID=UID
/INDEX=SORC
/GROUPBY=VARIABLE
/VIND ROOT=ind.
CASESTOVARS
如图:
前一篇:八亿用户数据分析经验分享