数据分析的定义:
数据从哪里来?
计量和记录把客观发生的事件量化成为数据
数据分析:
通过适当的数学方法和统计方法把隐藏在数据中的规律总结出来。
数据分析的作用
通过数据分析,支撑企业的决策和判断。>>>数据仓库由此而来
在企业中,数据分析分为三个方向:
原因分析----历史数据>>>离线分析
现状分析----当前数据>>>实时分析
预测分析----结果数据>>>机器学习(数据挖掘)
数据分析基本步骤
#1 明确分析目的和思路
指引分析的方法,思路如何开展数据分析。
分析思路由一些营销管理类的理论做支撑(数据分析方法论)
参考我的 专栏:数据分析方法论
#2:数据收集
数据库,互联网,爬虫,市场调研等。
#3:数据处理
把非结构化的数据,变成结构化数据,去除无用数据。
#4:数据分析
通过适当的数据分析方法,找出隐藏的规律。数据挖掘某种程度上属于数据分析,侧重于数学应用的几个层面(分类,聚类,关联,预测)
#5:数据展现
尽量用图表的方法展示数据分析的结果。比如echart
#6:报告撰写
对于数据分析做一个整个流程的总结和呈现。
互联网对企业的挑战:
网站架构变迁-->>分布式
分布式(distributed)是指在多台不同的服务器中部署不同的服务模块,通过远程调用协同工作,对外提供服务。
集群(cluster)是指在多台不同的服务器中部署相同应用或服务模块,构成一个集群,通过负载均衡设备对外提供服务。
区别:
| 分布式 | 集群 |
共同点 | 多台机器 | 多台机器 |
不同点 | 每台机器服务不一样 | 每台机器都是一样的 |
海量数据的处理场景:
海量数据的存储问题》》》分布式存储
海量数据的计算问题》》》分布式计算
什么是大数据?