加载中…
个人资料
Stata连享会
Stata连享会
  • 博客等级:
  • 博客积分:0
  • 博客访问:37,804
  • 关注人气:21
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

R中变量标签管理

(2023-05-10 22:31:44)
标签:

stata

r语言

标签管理

分类: Stata编程
全文阅读:https://www.lianxh.cn/news/8011d72287c3b.html

目录

 


1. 引言

变量标签是一个变量的详细名字,尽管 R 中可以将变量的名字取得非常长,甚至名字中可以包含空格和标点,但是短小的名字更容易进行编程。此时一个能够对变量进行一个非常漂亮而且详尽的描述的变量标签便显得极为重要了。通过这样的变量标签,我们可以非常容易地记住一个变量的名字指代的是什么。

值标签和变量标签类似。但是值标签指的是对一个变量可能的取值进行的详尽描述,将一个类别变量的取值进行标记的好处在于我们不再需要记忆诸如 1=Extremely poor 或者 7=Excellent 之类的含义了,因而我们可以很容易地通过 info 得到数据集的描述性分析和变量的描述性统计。

一般而言,将数值型数据和 R 中的标签关联起来的是因子变量,然而因子变量只能允许整数映射到一个文字标签当中,而这些整数必须是以 1 开始的,同时每一个值都必须有一个标签。同样,我们不能对因子变量计算均值或者其他的统计量。

通过标签我们能够在编程的时候使用短小的变量名字,而在结果输出的表格中我们能够看到文字版本的标签,这样对于结果的可视性有着非常大的帮助。

尽管在 R 中将标签作为变量的属性进行存储是一件非常方便的事情,但是绝大多数的 R 包并不能使用这些标签,甚至是删除这些标签。本文将要介绍的两个包:第一个包是 expss,它能够将值标签整合到 R 中的基础函数和其他包中的函数中,其中的函数 use_labels 能够很大程度上简化变量标签的使用;第二个包是 labelled


0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有