加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

解决stata的dta数据文件中文字符变量乱码问题

(2021-01-08 21:55:41)
标签:

cnvita

stata16

dta文件

中文乱码

分类: 软件
假设数据集为A.dta
dta文件中的中文字符变量在Stata中打开后是乱码
这是Stata不同版本对中文字符编码翻译采用了不同标准导致的
操作步骤如下:

先清除目前的乱码数据

      · clear

然后,将需要编码的文件,放入当期工作路径(current working directory),通常在Stata的左下角显示。
  
使用命令 unicode analyze 分析数据集 A.dta 是否需要编码翻译。

  . unicode analyze A.dta
  
  如果结果显示,有一个字符串变量需要编码翻译(1 str# variable needs translation)则将编码设为国标码(GB18030),再进行翻译。

  . unicode encoding set gb18030
  (default encoding now gb18030)

  . unicode translate A.dta
  (using gb18030 encoding)
  
  结果显示,此文件已编码翻译成功。
  再次打开此数据集,并通过数据编辑器 “Data Editor (Browse)” 查看,即可得到正常显示无乱码的数据集。

0

阅读 收藏 喜欢 打印举报/Report
前一篇:stata16
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有