弯道超车之Excel课程4
标签:
文化 |
分类: 茜¥职场女生#学无止境 |
31、整理篇——源数据制表避坑(下)
- 不理解标题行。标题行与工作表标题是两个概念,标题行指的是表每列内容的标题,影响着源数据表的规范性。
- 单元格复合属性。尽可能将单元格拆到最小,最精准,单元格内容属性越单一越好。这样可以直接用于数据透视表或分类汇总,不用再去用分列工具处理或者用公式来计算
- 选错数据格式。制作源数据表时,要选对单元格格式,数字文本要区分,时间日期要匹配。
- 胡乱添加表头。合格的源数据表,表头一定是要单一纯粹的。不然会弹出“数据透视表字段名无效”的提示。
- 相同数据不一致。保持统一,EXCEL才会在统计分析的时候,把它们当成是同一种数据来分析,结果才会准确。
- 遗留空单元格。正确区分空值和零值,确保数据结构完整无缺失。
- 其它。不要乱添加汇总行,在数据透视表中会自动生成;一行数据对应一条完整的信息。在第一列可以添加序号从1到N。
32、整理篇——趁早食堂调研报告大改造
- 旧表分析。分清表标题和工作表名称,删除无意义的分隔行。
- 源数据记录表。源数据都罗列在标题栏,制作表头。
- 选项参数表。参数表就是把答案做成相对固定的条目,使用数据验证的方式,做成动态数据源。
- 数据分析表。选中数据中任意格,点击“插入-数据透视表”,然后在右侧的“数据透视表字段”中进行设置。
- 数据呈现表。点击透视表,选择“插入-数据透视图”,选择簇状柱形图,就可以得到直观的对比图,也可以“插入-切片器”,对数据进行筛选。
33、整理篇——数据清洗全流程预览
- 什么是数据清洗。清除掉重复、多余的数据,补全缺失数据,纠正或删除错误数据。使整个数据源表成为规范,干净的格式,可以更方便、直接、准确地用于数据分析。
- 数据清洗的四大心法。完善性、全面性、合法性和唯一性。
- 数据清洗的全流程。
- (1)备份数据——复制留存一份原始数据,如操作失误或误删除,可以找回。
- (2)无意义字段处理——选择目标列,快捷键Ctri+0,把对分析无意义的字段隐藏。
- (3)规范列命名和格式——基本原则是简单、清晰、最好使用中文。
- (4)单元格格式处理——统一字体、字号、颜色等细节,文本格式要转换成数字格式,统一小数位,日期时间格式也要统一。
- (5)删除重复值——查找、标记、删除重复项。
- (6)复合属性单元格处理——一个单元格只能保留单一属性的内容信息,区分数字和文本。
- (7)一致化处理——所有的同类数据要使用相同的度量单位,一致数据要使用一致的单元格格式和表达方式。
- (8)异常值处理——大量数据需要使用标准偏差分析的方式来解决。
- (9)缺失值处理——可以手动补全缺失值,直接删除缺失值,用预估的平均值代替,或是用统计模型计算一个模似数据代替。
- (10)数据排序。根据分析处理的需要,可以对数据进行重新排列。
34、整理篇——文本清洗函数(上)
- LEFT,=LEFT(要提取的文本或字符串,要提取的数量)。
- RIGHT,=RIGHT(要提取的文本或字符串,要提取的数量)
- MID,=MID(要提取的文本或字符串,从第几位开始,要提取的数量)
35、整理篇——文本清洗函数(下)
- LEN,=LEN(字符串),主要功能是计算字符串的数量。
- FIND,=FIND(要找的内容,在哪找,从第几位开始)
36、整理篇——文本替换函数
- SUBSTITUTE,替换字符串指定内容,类似于Ctrl+H的查代替换功能,优点是随源数据实时变化。= SUBSTITUTE(要替换的字符串本身,想要替换的旧内容,替换为的新内容)。
- REPLACE,替换字符串指定位置、指定长度的内容。=REPLACE(字符串,开始位置,替换位数,新文本)
37、整理篇——文本修剪函数
- 区域单元格清洗。提取横线左边的数值——提取右边的数值——提取单位——给单位做一列换算辅助列。
- TRIM,除了单词之间的单个空格外,清除文本中的所有空格。=TRIM(文本字符串)。
- CLEAN,删除单元格内,当前操作系统无法打印的字符。=CLEAN(文本字符串)。
38、整理篇——查找和处理重复值
- 查找和处理重复值。条件格式/数据工具/高级筛选/数据透视表。
- 查找和处理差异值。Ctrl+\行内容差异
39、整理篇——清洗不规范的日期
- 标准日期格式。回车后自动居右对齐,编辑栏里斜杠分隔的形式,可以和数字运算,单元格格式预览可以变成数字。
- 五种典型的错误日期。快速填充/查找替换法/分列法/函数替换法/TEXT函数
- 五种文本转数字的方法。小叹号法/分列工具/运算法/减负法/涵数法。
40、整理篇——清洗单位不统一的时长
- 筛选法。获取数字,输入一个数字,回车,Ctrl+E;筛选单个字,Ctrl+shift+L打开筛选器,点开目标列的文本筛选;单位一致化计算,填充柄和函数。
- 函数法。借助LEFT、LEN和LENB,获取数字位数=LEN-(LENB-LEN)。
- ISERROR函数,功能是判断是否为错误值。=ISERROR(要判断的内容)。如果是错误值,返回TRUE。如果不是错误值,返回FALSE。
- IFERROR函数,功能是当结果为错误时,为它指定显示的内容。=IFERROR(要判断的内容,错误时显示)。
- 合并单位列。&连接法,单位转常量
前一篇:弯道超车之Excel课程3
后一篇:带娃打卡网红地——石家庄三日游

加载中…