视频课程 人浏览 历史评分   更新时间: 30天前 随到随学

课程介绍

注意0:欲购买此课程,获取安全购买链接,索要正版授权学习平台账号,务必加咨询QQ:2536379620
注意1:由于编码原因,试听课程视频画面清晰度不如最终购买的视频。最终购买视频的画面清晰度可参见以下两张图。图1   图2
注意2:正版良心视频,购买后有机会和原作者直接短暂技术交流。

注意3:感觉课程太难?没有信心?还在犹豫自己学的会学不会?我们的师傅带徒弟模式(5倍下单)会给您信心。我们承诺, 商品详情,教学大纲,视频内容,所涉及技术,可获得原创作者老师微信或QQ和针对视频范围的精心指导。线上一对一师带徒辅导问答,针对视频内代码调试,使命必达,视频之外相关技术内容,行业内信息人脉,企业内推(如有),原创作者老师会竭诚帮助。

以上所示价格,只能自行学习视频和获取少量解答。师傅带徒弟课程(5倍下单左右,可以先和客服联系,可获得老师的联系方法和针对视频范围的精心指导。线上一对一师带徒辅导问答,针对视频内代码调试,使命必达。)


数据分析职位是一个金饭碗的职位,前景美好,但是要全面掌握大数据分析技术,非常困难,大部分学员的痛点是不能快速找到入门要点,精准快速上手。
本课程采用项目驱动的方式,以Spark3和Clickhouse技术为突破口,带领学员快速入门Spark3+Clickhouse数据分析,促使学员成为一名高效且优秀的大数据分析人才。
        学员通过本课程的学习,不仅可以掌握使用Python3进行Spark3数据分析,还会掌握利用Scala/java进行Spark数据分析,多语言并进,力求全面掌握;另外通过项目驱动,掌握Spark框架的精髓,教导Spark源码查看的技巧;会学到Spark性能优化的核心要点,成为企业急缺的数据分析人才;更会通过Clickhouse和Spark搭建OLAP引擎,使学员对大数据生态圈有一个更加全面的认识和能力的综合提升。真实的数据分析项目,学完即可拿来作为自己的项目经验,增加面试谈薪筹码。

    Spark内核原理(RDD、DataFrame、Dataset、Structed Stream、SparkML、SparkSQL)
    Spark离线数据分析(千万简历数据分析、雪花模型离线数仓构建)
    Spark特征处理及模型预测
    Spark实时数据分析(Structed Stream)原理及实战
    Spark+Hive构建离线数据仓库(数仓概念ODS/DWD/DWS/ADS)
    Clickhouse核心原理及实战
    Clickhouse engine详解
    Spark向Clickhouse导入简历数据,进行数据聚合分析
    catboost训练房价预测机器学习模型
    基于Clickhouse构建机器学习模型利用SQL进行房价预测
    Clickhouse集群监控,Nginx反向代理Prometheus+Grafana+Clickhouse+node_exporter
    Spark性能优化
    Spark工程师面试宝典


课程涉及到的技术

Clickhouse集群监控实战截图:


课程大纲


01 Spark课程简介及环境安装

【录播】Spark3+Clickhouse课程大纲简介(12分钟)

【录播】大数据生态圈现状(12分钟)

【录播】彻底理解Spark RDD(14分钟)

【录播】开发环境安装JDK+Scala2.12(12分钟)

【录播】Spark3源码跟踪学习技巧(10分钟)

【录播】Spark IDEA调试环境搭建(7分钟)

【录播】Net网络配置及虚拟机静态IP配置(17分钟)

【录播】VMWare Workstation克隆主机(6分钟)

【录播】SSH无密钥登陆及关闭防火墙(7分钟)

【录播】Hadoop集群搭建(23分钟)

02 Hadoop/Yarn光速入门

【录播】Spark3.x集群搭建(7分钟)

【录播】Hadoop集群动态扩容(23分钟)

【录播】Yarn核心组件及调度原理(12分钟)

【录播】Spark Yarn两种调度模式原理及代码实战(24分钟)

03 Spark RDD光速入门

【录播】Spark JdbcRDD等多种方式创建RDD(27分钟)

【录播】Jupter Notebook PySpark学习环境搭建(10分钟)

【录播】累加器和广播变量等8个知识点(28分钟)

【录播】SparkContext上的20个知识点(11分钟)

【录播】combineByKey等6个知识点(22分钟)

【录播】牢记容易被混淆的xxxByKey算子(11分钟)

【录播】RDD集合的差并补集(18分钟)

【录播】RDD上其余的20个知识点(24分钟)

【录播】通过隐式转换扩充RDD转换算子(18分钟)

【录播】通过隐式转换扩充RDD Action算子(18分钟)

04 Spark RDD光速入门2

【录播】常用的Action算子汇总(1)(31分钟)

【录播】常见的Action算子汇总(2)(13分钟)

【录播】SparkConfig配置对象(13分钟)

【录播】Spark任务调度源码走读(31分钟)

【录播】基于Spark RDD的项目实战(14分钟)

05 DataFrame/Dataset光速入门

【录播】SparkSession详解(34分钟)

【录播】SparkSession read and write(19分钟)

【录播】SparkSQL模块简介(7分钟)

【录播】Spark DataFrame核心算子知识点16(35分钟)

【录播】Spark DataFrame核心知识点60(47分钟)

【录播】GroupedData和Column知识点(42分钟)

【录播】Catalog和Row知识点(15分钟)

【录播】空数据处理和数据统计(23分钟)

【录播】Spark读写数据详细知识点(33分钟)

【录播】Spark数据类型及functions核武库(50分钟)

06 SparkSQL进阶

【录播】基于DataFrame的数据挖掘实战(19分钟)

【录播】人生苦短我用SparkSQL(11分钟)

【录播】SparkSQL join原理及优化思路(37分钟)

【录播】SparkUDF用户自定义函数(12分钟)

【录播】Spark UDAF用户自定义聚合函数(10分钟)

【录播】SparkSQL整合Hive(30分钟)

【录播】Spark UDTF用户自定义表生成函数(10分钟)

【录播】SparkSQL性能优化数据倾斜之两阶段聚合(22分钟)

【录播】SparkSQL大表关联小表数据倾斜优化(14分钟)

【录播】Sql执行顺序及数仓分层理论(12分钟)

07 SparkSQL进阶2

【录播】SparkSQL+Hive构建离线数仓(38分钟)

【录播】DWD明细数据生成(13分钟)

08 Structured Streaming光速入门

【录播】Structured Streaming流式处理的两种模式(10分钟)

【录播】Structured Streaming核心概念(33分钟)

【录播】Structured Streaming滑动窗口和水印(38分钟)

【录播】Zokeeper集群搭建(17分钟)

【录播】Kafka集群搭建(25分钟)

【录播】pykafka推送hive订单数据到topic(28分钟)

【录播】Structured Streaming消费kafka数据(11分钟)

09 SparkML快速入门

【录播】机器学习项目python数据处理(21分钟)

【录播】SparkML向量及矩阵表示(23分钟)

【录播】SparkML中四种分布式矩阵表示(17分钟)

【录播】SparkML特征转换1(45分钟)

【录播】SparkML特征转换2(17分钟)

【录播】SparkML pipline管道(21分钟)

【录播】SparkML交叉验证及网格搜索(13分钟)

【录播】SparkML房价预测(21分钟)

10 Spark性能调优

【录播】Spark程序编写9大准则(28分钟)

【录播】Spark程序性能优化8大技巧(38分钟)

11 Clickhouse光速入门

【录播】Clickhouse安装及用户和密码配置(18分钟)

【录播】TinyLog、Memory、Merge引擎(16分钟)

【录播】MergeTree引擎开始学习(34分钟)

【录播】Clickhouse集群配置及分布式表(30分钟)

【录播】Clickhouse单机多实例部署(32分钟)

【录播】Clickhouse三机双实例部署(9分钟)

【录播】Clickhouse三分片两副本集群配置(9分钟)

【录播】ReplicatedMergeTree实战(25分钟)

【录播】查询工具Tabix及DBeaver配置及使用(14分钟)

【录播】SSB数据分析实战(38分钟)

12 clickhouse集群监控

【录播】Catboost安装及回归分析应用(21分钟)

【录播】Catboost回归模型在clickhouse sql中应用(30分钟)

【录播】Clickhouse集群监控之Prometheus安装(10分钟)

【录播】Clickhouse集群监控之Grafana配置(11分钟)

【录播】Clickhouse集群监控之node_exporter配置(12分钟)

【录播】Grafana导入clickhouse集群监控模板(3分钟)

【录播】Nginx反向代理Tabix+Pro+CK+Grafana(38分钟)

13 课程资料

【资料】代码课件(zip,54.8MB)


相关推荐
客服 关于