目录
一 明确分析目的
二 了解数据概况
拿到数据肯定是要先看一下的,你想要的数据全不全,拿到的数据有哪些可分析之处,主要
就是看数据字段,了解数据字段的含义
三 数据清洗
数据清洗一般包括无效值、缺失值、重复值处理;数据是否有乱码,错位现象;数据口径问
题,两张表的关联 ID 名是否一致;还有是否有统一的标准或命名
数据转换则是将数据规整为统一格式处理。因为这只是 Excel 级别的数据分析,就一张简单
的数据表,不会有太多复杂的操作
- 有无缺失值
- 脏数据处理
- 重复数据
- 数据再加工
四 分析过程
分析过程有很多玩法,如果主要数据是文本格式,数据又很简单,则偏向汇总统计的计算
如果数值型的数据比较多,就会涉及到统计、比例等概念。如果有时间类数据,那么还会有
趋势、变化的概念