加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

Stata数据处理:统计组内非重复值个数

(2020-10-31 22:47:24)
标签:

egenmore

distinct

tag()

stata

分类: Stata数据处理
🍎 全部阅读:https://www.lianxh.cn/news/3f5d25925cd54.html

目录

Note: 本文对命令的介绍基于 Nicholas J. Cox, Speaking Stata: Distinct observations, The Stata Journal (2008) 8, Number 4, pp. 557–568. PDF

本文以系统自带数据 auto.dta 进行介绍,如何识别一个变量或者一个数据集中有多少种不同的观察结果。例如,公司  在第  年发生了 30 多笔借贷业务,我们想知道这些业务涉及了多少家银行。

目前在 Stata 中有不少命令都可以处理这个问题,比如 contract duplicates ,但这些命令在实现过程都破坏了原有的数据结构。在这里,我们推荐两种方法,一种是使用 egen 命令自带的 tag() 函数来标记非重复值的出现与否,进而使用 total() 或 sum() 函数进行加总;另一种方法是直接使用外部命令 egenmore 提供的 nvals() 函数。

🍎 全文阅读:https://www.lianxh.cn/news/3f5d25925cd54.html

 

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有