解决stata的dta数据文件中文字符变量乱码问题
(2021-01-08 21:55:41)
标签:
cnvitastata16dta文件中文乱码 |
分类: 软件 |
假设数据集为A.dta
dta文件中的中文字符变量在Stata中打开后是乱码
dta文件中的中文字符变量在Stata中打开后是乱码
这是Stata不同版本对中文字符编码翻译采用了不同标准导致的
操作步骤如下:
先清除目前的乱码数据
·
clear
然后,将需要编码的文件,放入当期工作路径(current working directory),通常在Stata的左下角显示。
使用命令 unicode analyze 分析数据集 A.dta 是否需要编码翻译。
. unicode analyze A.dta
如果结果显示,有一个字符串变量需要编码翻译(1 str# variable needs translation)则将编码设为国标码(GB18030),再进行翻译。
. unicode encoding set gb18030
(default encoding now gb18030)
. unicode translate A.dta
(using gb18030 encoding)
结果显示,此文件已编码翻译成功。
然后,将需要编码的文件,放入当期工作路径(current working directory),通常在Stata的左下角显示。
使用命令 unicode analyze 分析数据集 A.dta 是否需要编码翻译。
. unicode analyze A.dta
如果结果显示,有一个字符串变量需要编码翻译(1 str# variable needs translation)则将编码设为国标码(GB18030),再进行翻译。
. unicode encoding set gb18030
(default encoding now gb18030)
. unicode translate A.dta
(using gb18030 encoding)
结果显示,此文件已编码翻译成功。
再次打开此数据集,并通过数据编辑器 “Data
Editor (Browse)” 查看,即可得到正常显示无乱码的数据集。