Stata数据处理：一些技巧和建议_Stata连享会

个人资料

微博

正文字体大小：大中小

Stata数据处理：一些技巧和建议

(2023-03-04 11:08:13)

标签：

分类： Stata数据处理

当你面对一个数据集的时候，你的第一目标便是理解这一个数据集，然后尝试去清洗它。从逻辑上讲，这是两个独立的过程，但是在实际操作的过程中，这两步往往是相互交错的。在没有完全理解之前是不可能清洗干净数据的，同样在清洗干净数据之前你也无法完全理解这份数据。

我们下面以 2000_acs_sample.dta 数据集为例。这是 2000 年美国社区调查数据的一个无加权样本，但是我们这里只是随机取出 1% 的样本用以展示。

阅读文件：当我们面对一个未知的数据集的时候，如果这份数据集中存在一个解释文档，那么我们就应该多花一些时间在这份解释文档中，这份文档往往对你理解这份数据至关重要。但是如果没有这样的解释文档，我们就应该仔细审视这份数据集已获得关键信息。

识别变量：describe 能够为我们提供基本但是很有用的数据集信息。其主要作用在于观察你有什么样的变量以及变量的名字，变量的标签能够帮助你理解他们是什么意思。

阅读┊ 收藏 ┊ 喜欢 ▼ ┊打印┊举报/Report