加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

SPSS中的语法编辑功能

(2011-08-25 16:36:41)
标签:

语法编辑

自动

script

it

分类: SPSS
由于现有的系统没有报表,需要分析的时候我要先把数据从MongoDB导出成csv文件,然后再经过一系列转化,最后还要提取有用的信息进行合并分析。
比如,系统中的发微博数量与评论数量分别放在两张表中,导出来以后的文件分别是T_MicroBlog及T_Comment,并且由于是使用mongoexport工具导出来的,所以时间格式保存为{"data": xxxxxxx}这样的格式,必须转化yyyy-mm-dd形式才有利用分析。最后需要比较每天微博数量与评论数量的关系。
每次都执行一遍很繁琐,还好SPSS支持脚本,现在就来看看部分脚本吧:
60~69行将csv文件载入到spss中
71~73行将其中的sendTime字段转成合法的"yyyy/mm/dd"格式的日期字符串
75~77行将转换化的文件保存到sav文件中
79~83行对数据时行分组(sendTime)合并(频率)并写到一个新的数据集CommentCount中
85~87行将数据集CommentCount保存
89~92行将评论数量与微博数量(之前用类似的方法处理过)BlogCount进行合并。合并的依据是sendTime。合并之前必须先排序,即86行的SORT CASES

数据已经准备完成,现在利用这个数据生成散点图,同样通过脚本来进行:
由于我不关心7月1号之前的数据,所以把它过滤掉
94~100行的作用就是把2011/07/01之前的数据过滤掉,不参与统计
102~114行就是生成散点图

最后输出的图形如下:

不知道能否做成自动执行呢?需要继续深入。 2011/08/25




0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有