多变量排序问题:以中国工业企业数据库为例
(2023-02-04 16:30:05)
标签:
stata多变量排序中国工业企业数据库 |
分类: Stata推文 |
全文阅读:https://www.lianxh.cn/news/95ddd1a8bfbae.html
目录
1. 引言
中国工业企业数据库是经济学科研中较为常见的数据库,其涉及变量较多,通常有几十个甚至上百个。多数科研小白或学者在刚拿到未经整理的工业企业数据库时通常会犯难。太多的变量毫无头绪,无论使用手工删除亦或是代码删除的方式均较为繁琐,且工业企业数据库通常作为面板数据出现,涉及的年份较多,如果每年都手工查找变量或删除变量,工作量将会非常庞大。
因此,在对变量名称规整后,将具有研究价值的变量进行排序,这样不仅使得数据的条理性更为清晰,而且会减小内存占用,提高数据处理的效率。类似中国工业企业数据库这样连续年份的多期数据还有很多,如《全国地市县财政统计资料》,《中国城市统计年鉴》等,大部分多期的数据资料都存在着变量变化的问题,在处理这些资料时候,对变量排序尤为重要。