视频课程 人浏览 历史评分   更新时间: 30天前 随到随学
课程介绍

注意0:欲购买此课程,获取安全购买链接,索要正版授权学习平台账号,务必加咨询QQ:2536379620
注意1:由于编码原因,试听课程视频画面清晰度不如最终购买的视频。最终购买视频的画面清晰度可参见以下两张图。图1   图2
注意2:正版良心视频,购买后有机会和原作者直接短暂技术交流。

ETL是数据仓库类项目建设的开始。它是完成模型设计之后开始数据应用分析之前的最为核心的一步。 相对于关系数据库,数据仓库技术没有严格的数学理论基础,它更面向实际工程应用。所以从工程应用的角度来考虑,按着逻辑数据模型的要求加载数据并对数据进行一系列处理,数据处理过程需要ETL开发工程师具备比较丰富的技术经验和数据仓库建模经验,同时这部分的工作直接关系数据仓库中数据的质量,从而影响到联机分析处理和数据挖掘的结果的质量。 可以说ETL开发工程师的工作至关重要。

SQL语言基础:sql/PLSQL语言基础-至少能够使用这个语言
ETL工具基础:了解ETL工具的常见功能,诸如加载文件,与传统数据仓库平台或大数据平台的交互方式,输出数据等(至少知道一款工作在项目中如何使用)
建模基础:具备金融行业或者通信行业主流模型的一些基本概念,诸如模型主题,模型分层,数据整合等
Linux基础:SHELL语言基础,Linux系统基本操作基础,如文件权限改变,部署应用,修改环境变量,执行sh程序等
Hadoop基础:了解Hadoop的体系架构,常用组件的使用,如HDFS上传文件,sqoop使用
Hive基础:了解Hive的体系架构,Hive的常见操作,如创建内部表,外部表,分区表等

课程大纲

01.

SQL数据处理与分析-零基础必学(10节)
1.1.0 SQL课程概述
23分钟
2.1.1 为什么学习数据库
9分钟
3.1.2 什么是数据库
17分钟
4.1.3 什么是SQL
11分钟
5.1.4 MySQL下载与安装
33分钟
6.1.5 MySql 命令行
18分钟
7.1.6 认识DBevear
25分钟
8.1.7 如何用dbeaver连接数据库
12分钟
9.1.8 如何在dbeaver中写SQL代码
16分钟
10.1.9 如何导出结果数据
10分钟
02.

SQL数据处理与分析-SQL基础知识(10节)
1.2.1 前言: SQL语言的构成
4分钟
2.2.1.1 数据库的删除与创建
14分钟
3.2.1.2 创建与删除表
6分钟
4.2.1.3 数据类型
5分钟
5.2.1.4 创建与删除表案例
11分钟
6.2.1.5 查看数据库与表
6分钟
7.2.1.6 ALTER TABLE语句
13分钟
8.2.1.7 练习及经验分享
5分钟
9.2.2 前言:数据操作语言
4分钟
10.2.2.1 Insert 向表中插入数据
20分钟
03.

SQL数据处理与分析-SQL基础知识(2节)
1.2.2.2 Updata 更新表中相关数据
7分钟
2.2.2.3 Delete 删除表中的记录
5分钟
04.

SQL数据处理与分析-SQL核心语句(6节)
1.3.1 基本查询语法:select&from
14分钟
2.3.2 查询结果不重复:distinct
13分钟
3.3.3 Where:查询条件
25分钟
4.3.4 Where查询条件之模糊查询like
9分钟
5.3.5 相关字段统计group by& 统计汇总函数
23分钟
6.3.6 对汇总结果进行过滤:having
13分钟
05.

SQL数据处理与分析-SQL核心语句(6节)
1.3.7 前言:SQL函数介绍
4分钟
2.3.8 数据格式函数
16分钟
3.3.9 常用时间函数
25分钟
4.3.10 字符函数
15分钟
5.3.11 数学函数
16分钟
6.3.12 控制函数
23分钟
06.

数据仓库原理与数据建模(1节)
1.1 数据仓库与数据建模
18分钟
07.

数据仓库原理与数据建模-数据仓库的逻辑架构(3节)
1.2.1 数据仓库逻辑架构浅析
56分钟
2.2.2 数据仓库模块功能分解
6分钟
3.2.3 数据分层的意义
7分钟
08.

数据仓库原理与数据建模-数据仓库与大数据平台与ETL之间关系(4节)
1.3.1 什么是大数据平台
45分钟
2.3.2 ETL架构概览
50分钟
3.3.3 数据仓库与ETL之间的关系
27分钟
4.3.4 大数据平台遇见数据仓库
48分钟
09.

数据仓库原理与数据建模-数据仓库建模过程(4节)
1.4.1 源系统调研分析
30分钟
2.4.2 选择建模架构
29分钟
3.4.3 生成逻辑模型
20分钟
4.4.4 逻辑模型物理化
18分钟
10.

数据仓库原理与数据建模-数据仓库建模工具Powerdesign使用培训(2节)
1.5.1 数据仓库建模工具简介
29分钟
2.5.2 Powerdesigner工具使用介绍
43分钟
11.

数据仓库原理与数据建模-银行数据仓库模型项目创建流程(6节)
1.6.1 银行数据仓库项目背景介绍
5分钟
2.6.2 源系统调研
18分钟
3.6.3 数据仓库模型设计以及ETL开发等
46分钟
4.6.4 数据仓库核心技能选型
25分钟
5.6.5 数据仓库各指标数据验证
15分钟
6.6.6 数据仓库系统投产上线
23分钟
12.

大数据处理框架Hadoop(4节)
1.1.1 分布式集群
19分钟
2.1.2 分布式系统理论
15分钟
3.1.3 Hadoop 概述
42分钟
4.1.4 Hadoop 3.0生态
14分钟
13.

Hadoop环境配置(4节)
1.2.1 Hadoop分布式基础环境的准备(上)
38分钟
2.2.2 Hadoop分布式基础环境的准备(下)
28分钟
3.2.3 Hadoop分布式环境的搭建(上)
46分钟
4.2.4 Hadoop分布式环境的搭建(下)
56分钟
14.

Hadoop综合实战案例(10节)
1.3.1.1 数据和需求介绍
5分钟
2.3.1.2 案例1需求分析
8分钟
3.3.1.3 案例1 mapper实现
14分钟
4.3.1.4 案例1 reducer和driver实现
11分钟
5.3.1.5 案例1 排序实现
14分钟
6.3.1.6 案例1 job调度
6分钟
7.3.2.1 案例2需求分析
7分钟
8.3.2.2 案例2生成拼接文件
29分钟
9.3.2.3 案例2电影评分计算
12分钟
10.3.2.4 案例2排序取前10
16分钟
15.

Hadoop综合实战案例(7节)
1.3.3.1 案例3需求分析
3分钟
2.3.3.2 案例3代码实现
13分钟
3.3.4.1 案例4需求分析
4分钟
4.3.4.2 案例4代码实现年份的评分个数
13分钟
5.3.4.3 案例4代码实现获取评分个数最多的年
10分钟
6.3.4.4 案例4大于4的电影
18分钟
7.3.4.5 案例4代码实现个数最多的前10个
13分钟
16.

Hive实战(10节)
1.1.1 什么是hive
14分钟
2.1.2 hive的优缺点和架构_3
12分钟
3.1.3 hive的执行流程与数据库的比较
7分钟
4.2.1 使用derby存储元数据 搭建hive
12分钟
5.2.2 使用mysql存储元数据搭建hive
22分钟
6.2.3 hive的三种连接方式
30分钟
7.3 hive的数据类型
21分钟
8.4.1 hive 的DDL数据定义-数据库
14分钟
9.4.2 hive 的表创建语法解析
13分钟
10.4.3 hive 的管理部和外部表
44分钟
17.

Hive实战(5节)
1.5.1 hive 数据load导入方式1
18分钟
2.5.2 hive 数据load导入方式2
4分钟
3.5.3 hive 数据insert导入方式
14分钟
4.5.4 hive 数据location导入方式
5分钟
5.5.5 hive 数据导出方式
16分钟
18.

Hive实战(10节)
1.5.6 hive 查询语句格式及数据准备
11分钟
2.5.7 hive 基本查询
17分钟
3.5.8 hive 基本查询1
23分钟
4.5.9 hive 基本查询2
15分钟
5.5.10 hive 的Order By
22分钟
6.5.11 hive 的分区概念
5分钟
7.5.12 hive的分区查询
14分钟
8.5.13 hive的分区添加删除和多分区查询
8分钟
9.5.14 hive 分区表和数据产生关联的三种方式
7分钟
10.5.15 hive的动态分区
4分钟
19.

Hive实战(10节)
1.5.16 hive的分桶
22分钟
2.6.1 hive函数nvl和case when
24分钟
3.6.2 hive concat相关连接函数
20分钟
4.6.3 hive 的explode函数
15分钟
5.6.4 hive 开窗函数1
15分钟
6.6.5 hive 开窗函数2
12分钟
7.6.6 hive开窗函数3
18分钟
8.6.7 hive开窗函数和日期转换函数
9分钟
9.6.8 hive 自定义函数UDF
22分钟
10.6.9 hive自定义函数UDTF
15分钟
20.

Hive实战(10节)
1.7.1 hive 优化文件格式选择
14分钟
2.7.2 hive 优化压缩格式选择
14分钟
3.7.3 hive 优化压缩比较1
7分钟
4.7.4 hive 优化压缩比较2
4分钟
5.8.1 hive 优化介绍
7分钟
6.8.2 hive 环境配置优化
11分钟
7.8.3 hive 调优 explain
9分钟
8.8.4 hive 调优fetch抓取和本地化优化
9分钟
9.8.5 hive调优 大表小表join
14分钟
10.8.6 hive调优空值过滤,倾斜和桶join
50分钟
21.

Hive实战(10节)
1.8.7 hive调优group by
11分钟
2.8.8 hive 调优count(distinct)
6分钟
3.8.9 hive 调优谓词下推
8分钟
4.8.10 hive调优设置map和reduce的个数
11分钟
5.8.11 hive 调优多重模式
6分钟
6.8.12 hive 调优严格模式
5分钟
7.9.1 hive 综合案例数据准备
8分钟
8.9.2 hive综合案例1
13分钟
9.9.3 hive 综合案例2
13分钟
10.9.4 hive综合案例3
5分钟
22.

Hive实战(3节)
1.9.5 hive综合案例4
23分钟
2.9.6 hive综合案例5
15分钟
3.9.7 hive综合案例6
29分钟






相关推荐
客服 关于