视频课程 人浏览 历史评分   更新时间: 30天前 随到随学

课程介绍

注意0:欲购买此课程,获取安全购买链接,索要正版授权学习平台账号,务必加咨询QQ:2536379620
注意1:由于编码原因,试听课程视频画面清晰度不如最终购买的视频。最终购买视频的画面清晰度可参见以下两张图。图1   图2
注意2:正版良心视频,购买后有机会和原作者直接短暂技术交流。
    
注意3:感觉课程太难?没有信心?还在犹豫自己学的会学不会?我们的师傅带徒弟模式(5倍下单)会给您信心。我们承诺, 商品详情,教学大纲,视频内容,所涉及技术,可获得原创作者老师微信或QQ和针对视频范围的精心指导。线上一 对一师带徒辅导问答,针对视频内代码调试,使命必达,视频之外相关技术内容,行业内信息人脉,企业内推(如有),原创作者老师会竭诚帮助。

以上所示价格,只能自行学习视频和获取少量解答。师傅带徒弟课程(5倍下单左右,可以先和客服联系,可获得老师的联系方法和针对视频范围的精心指导。线上一对一师带徒辅导问答,针对视频内代码调试,使命必达。)


Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。Spark是UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室)所开源的类Hadoop MapReduce的通用并行框架,Spark,拥有Hadoop MapReduce所具有的优点;但不同于MapReduce的是——Job中间输出结果可以保存在内存中,从而不再需要读写HDFS,因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的MapReduce的算法。
Spark 是一种与 Hadoop 相似的开源集群计算环境,但是两者之间还存在一些不同之处,这些有用的不同之处使 Spark 在某些工作负载方面表现得更加优越,换句话说,Spark 启用了内存分布数据集,除了能够提供交互式查询外,它还可以优化迭代工作负载。
Spark 是在 Scala 语言中实现的,它将 Scala 用作其应用程序框架。与 Hadoop 不同,Spark 和 Scala 能够紧密集成,其中的 Scala 可以像操作本地集合对象一样轻松地操作分布式数据集。

课程目标

本系列课程将基于RedHat Linux 7.4版本、Hadoop 2.7.3、Spark 2 版本多面介绍大数据的整体内容,让学员深入理解并学习运行机制和原理,从而进一步学习大数据的相关内容。

适用人群

具备Java基础学员,并想进一步学习大数据的学员。

课程大纲

01
Spark Streaming基础

【录播】Spark Streaming课程概述(12分钟)        免费试学

【录播】什么是Spark Streaming和体系结构(13分钟)

【录播】演示Demo:NetworkWordCount(17分钟)

【录播】开发自己的NetworkWordCount程序(18分钟)
02
Spark Streaming进阶

【录播】StreamingContext(13分钟)

【录播】DStream简介(8分钟)

【录播】DStream中的转换操作(29分钟)

【录播】窗口操作(10分钟)

【录播】DStream的输入(20分钟)

【录播】DStream的输出(7分钟)

【录播】集成Spark SQL(16分钟)
03
使用外部数据源

【录播】集成Spark Streaming和Flume(1)(28分钟)

【录播】集成Spark Streaming和Flume(2)(5分钟)

【录播】Kafka消息系统简介和体系结构(16分钟)

【录播】搭建Kafka环境(18分钟)

【录播】集成Spark Streaming和Kafka(39分钟)
04
课程资料

【资料】课程资料(zip,13.7MB)
相关推荐
客服 关于