Stata数据处理：统计组内非重复值个数_Stata连享会

http://blog.sina.com.cn/u/2327811412

首页博文目录关于我

个人资料

微博

加好友发纸条

写留言加关注

博客等级：
博客积分：

博客访问：
关注人气：
获赠金笔：0支
赠出金笔：0支
荣誉徽章：

正文字体大小：大中小

Stata数据处理：统计组内非重复值个数

(2020-10-31 22:47:24)

标签：

egenmore

distinct

tag()

stata

分类： Stata数据处理

🍎 全部阅读：https://www.lianxh.cn/news/3f5d25925cd54.html

Note： 本文对命令的介绍基于 Nicholas J. Cox, Speaking Stata: Distinct observations, The Stata Journal (2008) 8, Number 4, pp. 557–568. PDF。

本文以系统自带数据 auto.dta 进行介绍，如何识别一个变量或者一个数据集中有多少种不同的观察结果。例如，公司在第年发生了 30 多笔借贷业务，我们想知道这些业务涉及了多少家银行。

目前在 Stata 中有不少命令都可以处理这个问题，比如 contract , duplicates ,但这些命令在实现过程都破坏了原有的数据结构。在这里，我们推荐两种方法，一种是使用 egen 命令自带的 tag() 函数来标记非重复值的出现与否，进而使用 total() 或 sum() 函数进行加总；另一种方法是直接使用外部命令 egenmore 提供的 nvals() 函数。

🍎 全文阅读：https://www.lianxh.cn/news/3f5d25925cd54.html

阅读┊ 收藏 ┊ 喜欢 ▼ ┊打印┊举报/Report

前一篇：Stata小白系列之二：数据拆分与合并

后一篇：Stata小白系列之一：调入数据

新浪BLOG意见反馈留言板　欢迎批评指正