视频课程 人浏览 历史评分   更新时间: 30天前 随到随学

课程介绍

注意0:欲购买此课程,获取安全购买链接,索要正版授权学习平台账号,务必加咨询QQ:2536379620
注意1:由于编码原因,试听课程视频画面清晰度不如最终购买的视频。最终购买视频的画面清晰度可参见以下两张图。图1   图2
注意2:正版良心视频,购买后有机会和原作者直接短暂技术交流。

在完成本课程后学员可掌握Java、sql、hadoop、Scala、spark、kafka、NiFi、数据仓库、数据治理、元数据等相关知识,具备大数据核心技术、精通sql技能、具备分布式存储、分布式处理框架、离线数据处理、流式数据处理、数据仓库构建、任务调度、推荐系统、机器学习等相关技能。完全具备企业级大数据项目开发能力。


全方位辅助学习
线上学习
9大阶段,6 个月的科学训练(课程回放永久有效)

实战扩展
真实项目实战,开拓思维方式和眼界

陪伴学习
每周作业点评,批改作业、日常答疑

定期测评
每周一个学习节点,把知识沉淀成能力

独家资料
独家资料随堂提供,深入回顾和拓展

源码开放
全套上限标准的项目,代码免费赠送

简历指导
助你打造优秀的,第一印象

面试无忧
面试前 1v1辅导,面试后 1v1 复盘二学习

课程大纲


01 大数据生态圈核心技术-分布式平台构建和数据处理基础(Hadoop)

【录播】什么是大数据和大数据分析(20分钟)

【录播】分布式运算原理(11分钟)

【录播】hadoop的基本介绍(17分钟)

【录播】hadoop基本架构(12分钟)

【录播】hadoop生态圈介绍(7分钟)

【录播】hadoop环境搭建(20分钟)

【录播】安装环境测试和hdp环境介绍(11分钟)

【录播】Namnode和SNameNode(12分钟)

【录播】DataNode讲解(10分钟)

【录播】hdfs组件和数据备份策略(15分钟)

02 大数据生态圈核心技术-分布式平台构建和数据处理基础(Hadoop)

【录播】hdfs文件读写原理和常用命令使用(12分钟)

【录播】HDFS的java客户端(22分钟)

【录播】代码测试(7分钟)

【录播】课堂总结(5分钟)

03 大数据生态圈核心技术-分布式平台构建和数据处理基础(Mapreduce)

【录播】mapreduce的基本介绍(14分钟)

【录播】mapreduce数据分析详细介绍(20分钟)

【录播】mapreduce-wordCount需求讲解(12分钟)

【录播】mapreduce实战mapper开发(22分钟)

【录播】mapreduce实战reduce和job开发(20分钟)

【录播】程序打包运行和总结(13分钟)

【录播】案例总结和原理剖析(11分钟)

【录播】数据原理和源码分析(9分钟)

【录播】什么是逻辑块(15分钟)

【录播】hdfs组件和数据备份策略(15分钟)

04 大数据生态圈核心技术-分布式平台构建和数据处理基础(Mapreduce)

【录播】Mapper和Reducer讲解(13分钟)

【录播】分布式缓存和Speculative(13分钟)

【录播】作业讲解(17分钟)

【录播】作业测试和总结(12分钟)

05 大数据生态圈核心技术-精通企业级数据仓库Hive开发(基础)

【录播】hive简介(18分钟)

【录播】hive实现WordCount及元数据管理(17分钟)

【录播】hive体系结构(14分钟)

【录播】hive数据类型和数据库操作(21分钟)

【录播】内部表和外部表的区别(20分钟)

【录播】hive外部表的详细操作(28分钟)

【录播】CTAS和CTE(23分钟)

【录播】临时表及对表的基本操作(15分钟)

【录播】hive静态分区讲解(22分钟)

【录播】hive的严格模式和动态分区(26分钟)

06 大数据生态圈核心技术-精通企业级数据仓库Hive开发(进阶)

【录播】Hive数据分桶(16分钟)

【录播】explode和lateralView讲解(18分钟)

【录播】hive的select虚拟列和基本的Join(8分钟)

【录播】hive虚拟列和基本的数据Join(16分钟)

【录播】hive的基本join操作(8分钟)

【录播】hive的LOAD和insert的使用(13分钟)

【录播】hive的数据迁移(11分钟)

【录播】按照position进行排序(9分钟)

【录播】sortBy,DistributeBy(5分钟)

【录播】GroupBy和having(13分钟)

07 大数据生态圈核心技术-精通企业级数据仓库Hive开发(高级)

【录播】Hive的集合set,list(9分钟)

【录播】数据分片(12分钟)

【录播】PERCENT_RANK讲解(7分钟)

【录播】FIRST_VALUE,LAST_VALUE(9分钟)

【录播】窗口函数-行类窗口的讲解(15分钟)

【录播】范围类窗口函数(8分钟)

【录播】hive的事务讲解(17分钟)

【录播】MERGE语法的使用(15分钟)

【录播】hive的自定义函数(18分钟)

【录播】hive性能优化(9分钟)

08 大数据生态圈核心技术-精通企业级数据仓库Hive开发(高级优化)

【录播】本地运行和JVM重用(8分钟)

【录播】总结(2分钟)

09 大数据生态圈核心技术-精通企业级数据仓库Hive项目实战(上)

【录播】项目需求介绍(6分钟)

【录播】数据模型介绍(19分钟)

【录播】业务数据清洗(13分钟)

【录播】业务数据分区(19分钟)

【录播】使用窗口函数过滤重复数据和分区(9分钟)

【录播】用户业务数据分析(10分钟)

【录播】交易业务数据分析一(14分钟)

【录播】交易业务数据分析二(20分钟)

【录播】交易业务数据分三(22分钟)

【录播】交易业务数据分四(27分钟)

10 大数据生态圈核心技术-精通企业级数据仓库Hive项目实战(下)

【录播】交易业务数据分五(9分钟)

【录播】商家维度数据分析一(21分钟)

【录播】商家维度数据分析二(25分钟)

【录播】满意度数据分析(25分钟)

【录播】数据可视化实现(6分钟)

11 大数据生态圈核心技术-NoSQL综述和Apache HBase基础

【录播】NoSql的基本概念(9分钟)

【录播】Nosql的分类和存储区别(13分钟)

【录播】Hbaes介绍(11分钟)

【录播】Hbase的用例(9分钟)

【录播】Hbase的物理架构(10分钟)

【录播】Hbase表和RegionServer的关系(10分钟)

【录播】hbase的rows(10分钟)

【录播】Hbase数据管理和体系结构优势(8分钟)

【录播】Hbase的Shell操作和总结(25分钟)

12 大数据生态圈核心技术-Nosql&Apache HBase API介绍及性能优化

【录播】Hbase的javaAPI(21分钟)

【录播】使用java客户端插入数据(10分钟)

【录播】使用java客户端扫描数据(18分钟)

【录播】使用Java客户端删除操作(14分钟)

【录播】代码测试(10分钟)

【录播】RestAPI的使用(14分钟)

【录播】Phoenix的使用(21分钟)

【录播】使用Hive关联Hbase表(11分钟)

【录播】名称空间,授权,数据压缩(13分钟)

【录播】Minor和Major压缩测路,总结(9分钟)

13 大数据生态圈核心技术-Apache Sqoop介绍及数据迁移

【录播】sqoop的介绍和数据准备(13分钟)

【录播】sqoop案例演示1(18分钟)

【录播】sqoop案例演示2(13分钟)

【录播】sqoop案例演示3(11分钟)

【录播】sqoop案例演示4(19分钟)

【录播】sqoop案例演示5(16分钟)

14 大数据高级开发核心技术-Scala编程基础

【录播】scala基本介绍(11分钟)

【录播】scala输出hello World!(8分钟)

【录播】变量和常量(17分钟)

【录播】函数(11分钟)

【录播】循环(20分钟)

【录播】map和filter方法讲解(12分钟)

【录播】break代码块(11分钟)

【录播】数据类型和Tuple的讲解(20分钟)

【录播】collection的介绍(14分钟)

【录播】数组的操作(15分钟)

15 大数据高级开发核心技术-Scala编程进阶

【录播】Set和Map的操作(21分钟)

【录播】枚举和Null(15分钟)

【录播】Noting,Nil,None,Option(22分钟)

【录播】Success,Failure原理(14分钟)

【录播】SuccessAndFailure案例(14分钟)

【录播】高阶函数(17分钟)

【录播】嵌套函数(10分钟)

【录播】柯里化(15分钟)

【录播】函数赋值和下划线的使用(20分钟)

【录播】Trait讲解(20分钟)

16 大数据高级开发核心技术-Scala编程高阶

【录播】Class和伴生对象(16分钟)

【录播】caseClass定义(11分钟)

【录播】CaseClass和Enumeration的区别(14分钟)

【录播】apply和unapply(15分钟)

【录播】Mixin多继承调用关系(9分钟)

【录播】列表生成式(22分钟)

【录播】正则表达式讲解(19分钟)

【录播】匹配分组(15分钟)

【录播】scala中嵌入Java代码(8分钟)

【录播】scala总结(5分钟)

17 Apache Spark分布式计算原理

【录播】RDD的Lineage和DAG和数据迁移(15分钟)

【录播】Spark的cache和checkpoint(42分钟)

【录播】广播变量的使用(13分钟)

【录播】分区的控制和数据倾斜(21分钟)

【录播】Spark加载CSV和Json数据文件(20分钟)

相关推荐
客服 关于