加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

数据管理与发展的眼光

(2018-11-05 21:59:16)
标签:

研究

杂谈

分类: 知无涯

昨天无意中撞见了一些关于数据管理的PPT,里头介绍了记录数据的方法,否则关键信息流失相当于资产浪费。我非常认同要做好记录这事,否则时间一长,别说跟别人共享了,就连自己都会搞不清楚怎么回事。

不准备赘述数据管理具体该怎么搞,感兴趣的朋友欢迎参考这个链接https://data.library.virginia.edu/data-management/plan/metadata/

不过我觉得可以用父母养孩子来理解这件事事情,一份数据诞生了。就要记录这个人/数据,为什么出生,谁是亲生父母,谁参与了备孕过程,中间经历了什么,孩子出生后都做过哪些健康检查,有什么特征,有什么潜在的毛病。之后是谁继续在养这个娃,中间有没有经历什么坏事。

有一些数据是会横向生长的,比如发展的很多研究都是追踪数据。数据在“成长”的过程中,如果不断的更换养父母,就会导致十分混乱的状况。但现实中这却很常见。我以前会想,为什么大家不能像对孩子一样对自己的数据呢?现在则多了几分理解:就算是一个家庭中,父母对自己的诸多子女也是常常偏心的,资源有限,真的顾不过来。

记得本科那会听王莉老师说很多做发展的学者自己死了,就把数据交给学生,学生继续追踪这批被试(参与研究的人),很感动。后来在宾大读博了,发现很多时候自以为的“感动”只是因为自己想得太浪漫了。

我导师的导师R教授把当年的实验录像邮寄到我们实验室,并不是因为生死问题,只是对这份数据失去了兴趣。我们实验室大多数人后来都参与了整理的工作,等录像全转换成了电子文件,R教授又重新感了兴趣。可见“兴趣”多么需要“便利”来支撑。这样一来一往也算是实现了资源的优化配置。

再回过头来说数据内容本身,核心思想在于要能够清晰的记录下一个数据是怎么从A状态到了B状态。虽然数据总量不变,但是会有recode,aggregate等,在原有的基础上形态会发生更复杂的变化,算是纵向生长。任何变化和操作都能有迹可查才能便于使用,而且也要注意管理成本的问题,比如分库就很有可能带来潜在的问题。

总的来说发展的眼光很重要,不管是横向还是纵向生长,都是发展变化。都值得用看待孩子的眼光来清晰的记录、存档和维护数据。

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有