视频课程 人浏览 历史评分   更新时间: 30天前 随到随学

课程介绍

注意0:欲购买此课程,获取安全购买链接,索要正版授权学习平台账号,务必加咨询QQ:2536379620
注意1:由于编码原因,试听课程视频画面清晰度不如最终购买的视频。最终购买视频的画面清晰度可参见以下两张图。图1   图2
注意2:正版良心视频,购买后有机会和原作者直接短暂技术交流。


适用人群 :

1.拥有理论基础扎实和想跳槽,且缺乏项目实战的学员
2.想了解和熟悉一些前沿技术在项目中的实践效果
3.不建议零基础购买课程。

一线在职架构师答疑,提供技术指导和支持,同时提供企业内训服务。

           

1、ETL(Extract-Transform-Load的缩写,即数据抽取、转换、装载的过程),对于企业或行业应用来说,我们经常会遇到各种数据的处理,转换,迁移,所以掌握一个ETL工具的使用,必不可少。
Kettle作为ETL工具是非常强大和方便的。Kettle是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行,绿色无需安装,数据抽取高效稳定。
Kettle中文名称叫水壶,该项目的主程序员MATT希望把各种数据放到一个壶里,然后以一种指定的格式流出。
Kettle这个ETL工具集,它允许你管理来自不同数据库的数据,通过提供一个图形化的用户环境来描述你想做什么,而不是你想怎么做。
Kettle中有两种脚本文件,transformation和job,transformation完成针对数据的基础转换,job则完成整个工作流的控制。
2、Clickhouse 是俄罗斯的“百度”Yandex公司在2016年开源的,一款针对大数据实时分析的高性能分布式数据库,与之对应的有hadoop生态hive,Vertica和百度出品的palo。这是战斗民族继nginx后,又开源的一款“核武器”。
Hadoop 生态体系解决了大数据界的大部分问题,当然其也存在缺点。Hadoop 体系的最大短板在于数据处理时效性。基于 Hadoop 生态的数据处理场景大部分对时效要求不高,按照传统的做法一般是 T + 1 的数据时效。即 Trade + 1,数据产出在交易日 + 1 天。
ClickHouse 的产生就是为了解决大数据量处理的时效性。独立于Hadoop生态圈。
3、Superset 是一款由 Airbnb 开源的“现代化的企业级 BI(商业智能) Web 应用程序”,其通过创建和分享 dashboard,为数据分析提供了轻量级的数据查询和可视化方案。
 Superset 的前端主要用到了 React 和 NVD3/D3,而后端则基于 Python 的 Flask 框架和 Pandas、SQLAlchemy 等依赖库,主要提供了这几方面的功能:
01、集成数据查询功能,支持多种数据库,包括 MySQL、PostgresSQL、Oracle、SQL Server、SQLite、SparkSQL 等,并深度支持 Druid。
02、通过 NVD3/D3 预定义了多种可视化图表,满足大部分的数据展示功能。如果还有其他需求,也可以自开发更多的图表类型,或者嵌入其他的 JavaScript 图表库(如 HighCharts、ECharts)。
03、提供细粒度安全模型,可以在功能层面和数据层面进行访问控制。支持多种鉴权方式(如数据库、OpenID、LDAP、OAuth、REMOTE_USER 等)。

基于Kettle+Clickhouse+Superset构建亿级大数据实时分析平台课程将联合这三大开源工具,实现一个强大的实时分析平台。
该系统以热门的互联网电商实际业务应用场景为案例讲解,对电商数据的常见实战指标处理使用kettle等工具进行了详尽讲解,具体指标包括:流量分析、新增用户分析、活跃用户分析订单分析、团购分析。能承载海量数据的实时分析,数据分析涵盖全端(PC、移动、小程序)应用。
项目代码也是具有很高的商业价值的,大家可以根据自己的业务进行修改,便可以使用。

本课程包含的技术:
开发工具为:IDEA
Kettle
Clickhouse
Superset
Binlog
Canal
Kafka
Hbase
Hadoop
Zookeeper
Flink
SpringBoot
SpringCould
Python
Ancona
MySQL


课程亮点:
1.与企业对接、真实工业界产品
2.强大的ETL工具Kettle全流程讲解实现
3.ClickHouse高性能列式存储数据库
4.Superset现代化的企业级BI可视化
5.数据库实时同步解决方案
6.集成Flink实时数据转换解决方案
7.主流微服务SpringBoot后端系统
8.互联网大数据企业热门技术栈
9.支持海量数据的实时分析
10.支持全端实时数据分析
11.全程代码实操,提供全部代码和资料
12.提供答疑和提供企业技术方案咨询

课程大纲

01.
实时数据分析平台第1章(10节)       免费试看

1.0、实时分析平台课程说明
7分钟
2.1、实时分析平台之Kettle初识讲解
8分钟
3.2、实时分析平台之Kettle安装部署
7分钟
4.3、实时分析平台之Kettle文本文件输入
8分钟
5.4、实时分析平台之Kettle Excel文件输入
4分钟
6.5、实时分析平台之Kettle CSV文件输入
6分钟
7.6、实时分析平台之Kettle文件XML输入
6分钟
8.7、实时分析平台之Kettle文件JSON输入
9分钟
9.8、实时分析平台之Kettle表输入
9分钟
10.9、实时分析平台之Kettle Excel文件输出
5分钟
02.
实时数据分析平台第2章(10节)

1.10、实时分析平台之Kettle文本文件输出
4分钟
2.11、实时分析平台之Kettle SQL文件输出
4分钟
3.12、实时分析平台之Kettle表输出
4分钟
4.13、实时分析平台之Kettle表数据更新
4分钟
5.14、实时分析平台之Kettle表数据插入更新
4分钟
6.15、实时分析平台之Kettle表数据删除
5分钟
7.16、实时分析平台之Switch-case控件实战
5分钟
8.17、实时分析平台之Kettle数据过滤控件实战
5分钟
9.18、实时分析平台之Kettle空操作控件实战
3分钟
10.19、实时分析平台之Kettle增加常量控件实战
3分钟
03.
实时数据分析平台第3章(10节)

1.20、实时分析平台之Kettle增加序列控件实战
3分钟
2.21、实时分析平台之Kettle值映射控件实战
6分钟
3.22、实时分析平台之Kettle终止控件实战
6分钟
4.23、实时分析平台之Zookeeper环境安装
6分钟
5.24、实时分析平台之Hadoop环境构建
9分钟
6.25、实时分析平台之Kafka环境构建
7分钟
7.26、实时分析平台之Hbase环境构建
13分钟
8.27、实时分析平台之Kettle Kafka插件安装
5分钟
9.28、实时分析平台之Kafka流应用控件实战
6分钟
10.29、实时分析平台之Java代码脚本控件实战
16分钟
04.
实时数据分析平台第4章(10节)

1.30、实时分析平台之业务结构讲解及表构建1
14分钟
2.31、实时平台之业务结构讲解以及表构建2
7分钟
3.32、实时平台之业务结构讲解以及表构建3
5分钟
4.33、实时分析平台之业务结构实体构建1
9分钟
5.34、实时分析平台之业务结构实体构建2
7分钟
6.35、实时分析平台之业务结构实体构建3
5分钟
7.36、实时分析平台之操作日志结构讲解
5分钟
8.37、实时分析平台之Hbase工具封装代码讲解
15分钟
9.38、实时分析平台之数据收集服务构建
13分钟
10.39、实时分析平台之用户状态数据处理
11分钟
05.
实时数据分析平台第5章(10节)

1.40、实时分析平台之Clickhouse讲解
6分钟
2.41、实时分析平台之Clickhouse环境安装
14分钟
3.42、ClickHouse数据类型以及常用操作
7分钟
4.43、Clickhouse Java使用实战讲解
8分钟
5.44、Kettle集成Clickhouse插件
4分钟
6.45、Kettle Clickhouse配置
5分钟
7.46、实时分析平台之Kettle Json输出实战
5分钟
8.47、Clickhouse数据处理Java代码编写
8分钟
9.48、Clickhouse数据处理Java脚本实战
10分钟
10.49、实时分析平台之Superset讲解
5分钟
06.
实时数据分析平台第6章(10节)

1.50、实时分析平台之Superset环境安装实战
8分钟
2.51、实时分析平台之Superset使用实战
14分钟
3.52、实时平台之流量新增用户数据解析提取1
13分钟
4.53、实时平台之流量新增用户数据解析提取2
16分钟
5.54、实时平台之流量新增用户数据解析提取3
4分钟
6.55、实时分析平台之流量新增用户数据过滤
4分钟
7.56、实时平台之流量新增用户数据常量设置
6分钟
8.57、实时平台之流量新增用户数据序列设置
5分钟
9.58、实时平台之流量新增用户数据设备映射
4分钟
10.59、实时平台之流量新增用户数据保存表输出
9分钟
07.
实时数据分析平台第7章(10节)

1.60、实时分析平台之流量新增用户统计表输出
7分钟
2.61、实时平台之流量新增用户统计插入更新
8分钟
3.62、Superset配置流量新增用户可视化
9分钟
4.63、实时平台之Superset中文乱码问题解决
2分钟
5.64、实时平台之浏览次数趋势分析流程讲解
4分钟
6.65、实时分析平台之天活跃用户分析流程讲解
3分钟
7.66、实时分析平台之周活跃用户分析流程讲解
3分钟
8.67、实时分析平台之Binlog讲解
7分钟
9.68、实时分析平台之Binlog使用以及查看
4分钟
10.69、实时分析平台之Canal讲解
4分钟
08.
实时数据分析平台第8章(5节)

1.70、Cannal安装以及整合Kafka实战
11分钟
2.71、实时分析平台之数据实时转换服务
7分钟
3.72、实时分析平台之订单趋势分析流程讲解
4分钟
4.73、实时平台之团购用户趋势分析流程讲解
4分钟
5.74、实时分析平台之部署以及整体效果演示
19分钟
相关推荐
客服 关于