视频课程 人浏览 历史评分   更新时间: 30天前 随到随学

课程介绍

注意0:欲购买此课程,获取安全购买链接,索要正版授权学习平台账号,务必加咨询QQ:2536379620
注意1:由于编码原因,试听课程视频画面清晰度不如最终购买的视频。最终购买视频的画面清晰度可参见以下两张图。图1   图2
注意2:正版良心视频,购买后有机会和原作者直接短暂技术交流。
    
注意3:感觉课程太难?没有信心?还在犹豫自己学的会学不会?我们的师傅带徒弟模式会给您信心。我们承诺, 商品详情,教学大纲,视频内容,所涉及技术,可获得原创作者老师微信或QQ和针对视频范围的精心指导。线上一对一师带徒辅导问答,针对视频内代码调试,使命必达,视频之外相关技术内容,行业内信息人脉,企业内推(如有),原创作者老师会竭诚帮助。

线上一对一师带徒辅导问答,针对视频内代码调试,使命必达。(本产品主要是卖问答服务,视频价格太低不单独卖,嫌价格高者勿拍)


Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。Spark是UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室)所开源的类Hadoop MapReduce的通用并行框架,Spark,拥有Hadoop MapReduce所具有的优点;但不同于MapReduce的是——Job中间输出结果可以保存在内存中,从而不再需要读写HDFS,因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的MapReduce的算法。
Spark 是一种与 Hadoop 相似的开源集群计算环境,但是两者之间还存在一些不同之处,这些有用的不同之处使 Spark 在某些工作负载方面表现得更加优越,换句话说,Spark 启用了内存分布数据集,除了能够提供交互式查询外,它还可以优化迭代工作负载。
Spark 是在 Scala 语言中实现的,它将 Scala 用作其应用程序框架。与 Hadoop 不同,Spark 和 Scala 能够紧密集成,其中的 Scala 可以像操作本地集合对象一样轻松地操作分布式数据集。

课程目标

本系列课程将基于RedHat Linux 7.4版本、Hadoop 2.7.3、Spark 2 版本多面介绍大数据的整体内容,让学员深入理解并学习运行机制和原理,从而进一步学习大数据的相关内容。

适用人群

具备Java基础学员,并想进一步学习大数据的学员。

课程大纲

01
知识回顾:Hive基础

【录播】知识回顾:Hive基础(14分钟)       免费试学
02
准备实验环境

【录播】准备实验环境(10分钟)
03
安装和配置MySQL数据库

【录播】安装和配置MySQL数据库(8分钟)
04
安装和配置Hadoop

【录播】安装和配置Hadoop(13分钟)
05
安装和配置Spark

【录播】安装和配置Spark(12分钟)
06
安装和配置Hive

【录播】安装和配置Hive(17分钟)
07
验证试验环境

【录播】验证试验环境(10分钟)
08
课程资料

【资料】课程资料(zip,1.5MB)
相关推荐
客服 关于