Spark Streaming入门 概述 应用场景 集成Spark生态系统的使用 Spark Streaming发展史 词频统计 使用spark-submit执行 使用spark-shell执行 工作原理 概述 Spark Streaming是核心Spark API的扩展,可实现实时数据流的可伸缩,高吞吐量,容错流处理。数据可以从像卡夫卡,室壁运动,或TCP套接字许多来源摄入,并且可以使用与像高级别功能表达复杂的算法来处理map,reduce,join和window。最后,可以将处理后的数据推送到文件系统,数据库和…