为了更好的学习和理解spark,也为了记录自己学习过程中的遇到的各种问题,方便以后查询,故谢了相关博客,也公开了代码和数据,代码基本都可以本地运行。论文部分由于是ppt,故没有放上来。总目录: SparkLearning代码和数据:https://github.com/xubo245/SparkLearning