解决stata的dta数据文件中文字符变量乱码问题_cnvita

个人资料

微博

正文字体大小：大中小

解决stata的dta数据文件中文字符变量乱码问题

(2021-01-08 21:55:41)

标签：

分类：软件

假设数据集为A.dta
dta文件中的中文字符变量在Stata中打开后是乱码

这是Stata不同版本对中文字符编码翻译采用了不同标准导致的

操作步骤如下：

先清除目前的乱码数据

· clear

然后，将需要编码的文件，放入当期工作路径（current working directory），通常在Stata的左下角显示。
　　
使用命令 unicode analyze 分析数据集 A.dta 是否需要编码翻译。

　　. unicode analyze A.dta
　　
　　如果结果显示，有一个字符串变量需要编码翻译（1 str# variable needs translation）则将编码设为国标码（GB18030），再进行翻译。

　　. unicode encoding set gb18030
　　(default encoding now gb18030)

　　. unicode translate A.dta
　　(using gb18030 encoding)
　　
　　结果显示，此文件已编码翻译成功。

　　再次打开此数据集，并通过数据编辑器 “Data Editor (Browse)” 查看，即可得到正常显示无乱码的数据集。

阅读┊ 收藏 ┊ 喜欢 ▼ ┊打印┊举报/Report

前一篇：stata16