一、概念 什么是Spark? Spark是一个快速、通用、可扩展的大数据分析引擎。 ( 详见官网:http://spark.apache.org/) 简介 1)于2009年诞生于加州大学,采用Scala语言编写。 2) 2010年开源。 3) 2013年6月成为Apache孵化项目。 4) 2014年2月成为Apache顶级项目。 特点 : 四个特性是什么? 高效性:基于内存的运算,相当于Hadoop的mapreduce的100倍,计算中的结果存在内存中,Spark实现了高效的DAG执行引擎。 易用性:Spark支…