加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

Stata数据处理:一些技巧和建议

(2023-03-04 11:08:13)
标签:

stata

数据处理

分类: Stata数据处理
全文阅读:https://www.lianxh.cn/news/8bafeab6f6d53.html

目录

 


1. 一些技巧

当你面对一个数据集的时候,你的第一目标便是理解这一个数据集,然后尝试去清洗它。从逻辑上讲,这是两个独立的过程,但是在实际操作的过程中,这两步往往是相互交错的。在没有完全理解之前是不可能清洗干净数据的,同样在清洗干净数据之前你也无法完全理解这份数据。

我们下面以 2000_acs_sample.dta 数据集为例。这是 2000 年美国社区调查数据的一个无加权样本,但是我们这里只是随机取出 1% 的样本用以展示。

阅读文件:当我们面对一个未知的数据集的时候,如果这份数据集中存在一个解释文档,那么我们就应该多花一些时间在这份解释文档中,这份文档往往对你理解这份数据至关重要。但是如果没有这样的解释文档,我们就应该仔细审视这份数据集已获得关键信息。

识别变量describe 能够为我们提供基本但是很有用的数据集信息。其主要作用在于观察你有什么样的变量以及变量的名字,变量的标签能够帮助你理解他们是什么意思。


0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有