一、MapReduce流程图:
二、MapReduce流程步骤:
三、思考
思考1:map数量是越多越好吗?
思考2:hdfs是否适合存储小文件(从MapReduce角度出发)
思考3: split与map的关系?
思考4:split切片的大小可以随意调整吗?
思考5:map的数量一定是与split数量一致吗?
思考6:map以什么样的格式读取数据呢?
思考7:reduce的个数可以调整吗?
思考8:reduce的个数会带来什么影响?
思考9:reduce发挥了什么作用?
思考10:map的数量可以通过配置文件配置吗?
思考11:整个MapReduce过程中,经过了几次排序,分别是?