加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

弯道超车之Excel课程4

(2023-04-27 14:18:46)
标签:

文化

分类: 茜¥职场女生#学无止境
31、整理篇——源数据制表避坑(下)
  • 不理解标题行。标题行与工作表标题是两个概念,标题行指的是表每列内容的标题,影响着源数据表的规范性。
  • 单元格复合属性。尽可能将单元格拆到最小,最精准,单元格内容属性越单一越好。这样可以直接用于数据透视表或分类汇总,不用再去用分列工具处理或者用公式来计算
  • 选错数据格式。制作源数据表时,要选对单元格格式,数字文本要区分,时间日期要匹配。
  • 胡乱添加表头。合格的源数据表,表头一定是要单一纯粹的。不然会弹出“数据透视表字段名无效”的提示。
  • 相同数据不一致。保持统一,EXCEL才会在统计分析的时候,把它们当成是同一种数据来分析,结果才会准确。
  • 遗留空单元格。正确区分空值和零值,确保数据结构完整无缺失。
  • 其它。不要乱添加汇总行,在数据透视表中会自动生成;一行数据对应一条完整的信息。在第一列可以添加序号从1到N。

32、整理篇——趁早食堂调研报告大改造
  • 旧表分析。分清表标题和工作表名称,删除无意义的分隔行。
  • 源数据记录表。源数据都罗列在标题栏,制作表头。
  • 选项参数表。参数表就是把答案做成相对固定的条目,使用数据验证的方式,做成动态数据源。
  • 数据分析表。选中数据中任意格,点击“插入-数据透视表”,然后在右侧的“数据透视表字段”中进行设置。
  • 数据呈现表。点击透视表,选择“插入-数据透视图”,选择簇状柱形图,就可以得到直观的对比图,也可以“插入-切片器”,对数据进行筛选。

33、整理篇——数据清洗全流程预览
  • 什么是数据清洗。清除掉重复、多余的数据,补全缺失数据,纠正或删除错误数据。使整个数据源表成为规范,干净的格式,可以更方便、直接、准确地用于数据分析。
  • 数据清洗的四大心法。完善性、全面性、合法性和唯一性。
  • 数据清洗的全流程。
  • (1)备份数据——复制留存一份原始数据,如操作失误或误删除,可以找回。
  • (2)无意义字段处理——选择目标列,快捷键Ctri+0,把对分析无意义的字段隐藏。
  • (3)规范列命名和格式——基本原则是简单、清晰、最好使用中文。
  • (4)单元格格式处理——统一字体、字号、颜色等细节,文本格式要转换成数字格式,统一小数位,日期时间格式也要统一。
  • (5)删除重复值——查找、标记、删除重复项。
  • (6)复合属性单元格处理——一个单元格只能保留单一属性的内容信息,区分数字和文本。
  • (7)一致化处理——所有的同类数据要使用相同的度量单位,一致数据要使用一致的单元格格式和表达方式。
  • (8)异常值处理——大量数据需要使用标准偏差分析的方式来解决。
  • (9)缺失值处理——可以手动补全缺失值,直接删除缺失值,用预估的平均值代替,或是用统计模型计算一个模似数据代替。
  • (10)数据排序。根据分析处理的需要,可以对数据进行重新排列。

34、整理篇——文本清洗函数(上)
  • LEFT,=LEFT(要提取的文本或字符串,要提取的数量)。
  • RIGHT,=RIGHT(要提取的文本或字符串,要提取的数量)
  • MID,=MID(要提取的文本或字符串,从第几位开始,要提取的数量)

35、整理篇——文本清洗函数(下)
  • LEN,=LEN(字符串),主要功能是计算字符串的数量。
  • FIND,=FIND(要找的内容,在哪找,从第几位开始)

36、整理篇——文本替换函数
  • SUBSTITUTE,替换字符串指定内容,类似于Ctrl+H的查代替换功能,优点是随源数据实时变化。= SUBSTITUTE(要替换的字符串本身,想要替换的旧内容,替换为的新内容)。
  • REPLACE,替换字符串指定位置、指定长度的内容。=REPLACE(字符串,开始位置,替换位数,新文本)

37、整理篇——文本修剪函数
  • 区域单元格清洗。提取横线左边的数值——提取右边的数值——提取单位——给单位做一列换算辅助列。
  • TRIM,除了单词之间的单个空格外,清除文本中的所有空格。=TRIM(文本字符串)。
  • CLEAN,删除单元格内,当前操作系统无法打印的字符。=CLEAN(文本字符串)。

38、整理篇——查找和处理重复值
  • 查找和处理重复值。条件格式/数据工具/高级筛选/数据透视表。
  • 查找和处理差异值。Ctrl+\行内容差异

39、整理篇——清洗不规范的日期
  • 标准日期格式。回车后自动居右对齐,编辑栏里斜杠分隔的形式,可以和数字运算,单元格格式预览可以变成数字。
  • 五种典型的错误日期。快速填充/查找替换法/分列法/函数替换法/TEXT函数
  • 五种文本转数字的方法。小叹号法/分列工具/运算法/减负法/涵数法。
40、整理篇——清洗单位不统一的时长
  • 筛选法。获取数字,输入一个数字,回车,Ctrl+E;筛选单个字,Ctrl+shift+L打开筛选器,点开目标列的文本筛选;单位一致化计算,填充柄和函数。
  • 函数法。借助LEFT、LEN和LENB,获取数字位数=LEN-(LENB-LEN)。
  • ISERROR函数,功能是判断是否为错误值。=ISERROR(要判断的内容)。如果是错误值,返回TRUE。如果不是错误值,返回FALSE。
  • IFERROR函数,功能是当结果为错误时,为它指定显示的内容。=IFERROR(要判断的内容,错误时显示)。
  • 合并单位列。&连接法,单位转常量
弯道超车之Excel课程4

弯道超车之Excel课程4

弯道超车之Excel课程4

弯道超车之Excel课程4

弯道超车之Excel课程4

弯道超车之Excel课程4

弯道超车之Excel课程4

弯道超车之Excel课程4

弯道超车之Excel课程4

弯道超车之Excel课程4


0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有