R中变量标签管理_Stata连享会

http://blog.sina.com.cn/u/2327811412

首页博文目录关于我

个人资料

微博

加好友发纸条

写留言加关注

博客等级：
博客积分：

博客访问：
关注人气：
获赠金笔：0支
赠出金笔：0支
荣誉徽章：

正文字体大小：大中小

R中变量标签管理

(2023-05-10 22:31:44)

标签：

stata

r语言

标签管理

分类： Stata编程

全文阅读：https://www.lianxh.cn/news/8011d72287c3b.html

1. 引言

变量标签是一个变量的详细名字，尽管 R 中可以将变量的名字取得非常长，甚至名字中可以包含空格和标点，但是短小的名字更容易进行编程。此时一个能够对变量进行一个非常漂亮而且详尽的描述的变量标签便显得极为重要了。通过这样的变量标签，我们可以非常容易地记住一个变量的名字指代的是什么。

值标签和变量标签类似。但是值标签指的是对一个变量可能的取值进行的详尽描述，将一个类别变量的取值进行标记的好处在于我们不再需要记忆诸如 1=Extremely poor 或者 7=Excellent 之类的含义了，因而我们可以很容易地通过 info 得到数据集的描述性分析和变量的描述性统计。

一般而言，将数值型数据和 R 中的标签关联起来的是因子变量，然而因子变量只能允许整数映射到一个文字标签当中，而这些整数必须是以 1 开始的，同时每一个值都必须有一个标签。同样，我们不能对因子变量计算均值或者其他的统计量。

通过标签我们能够在编程的时候使用短小的变量名字，而在结果输出的表格中我们能够看到文字版本的标签，这样对于结果的可视性有着非常大的帮助。

尽管在 R 中将标签作为变量的属性进行存储是一件非常方便的事情，但是绝大多数的 R 包并不能使用这些标签，甚至是删除这些标签。本文将要介绍的两个包：第一个包是 expss，它能够将值标签整合到 R 中的基础函数和其他包中的函数中，其中的函数 use_labels 能够很大程度上简化变量标签的使用；第二个包是 labelled。

全文阅读：https://www.lianxh.cn/news/8011d72287c3b.html

阅读┊ 收藏 ┊ 喜欢 ▼ ┊打印┊举报/Report

前一篇：Python：从随机实验到双重机器学习

后一篇：从科研新手到审稿专家

新浪BLOG意见反馈留言板　欢迎批评指正