课程介绍
注意0:欲购买此课程,获取安全购买链接,索要正版授权学习平台账号,务必加咨询QQ:2536379620
注意1:由于编码原因,试听课程视频画面清晰度不如最终购买的视频。最终购买视频的画面清晰度可参见以下两张图。图1 图2
注意2:正版良心视频,购买后有机会和原作者直接短暂技术交流。
本课程价格是视频加师傅带徒弟保姆式答疑。只需视频 ,无需答疑者勿拍 。(纯视频不单卖,以此为理由不接受退款)答疑和视频分别付款。因为有人会单独购买答疑辅导部分。答 疑部分不允许单独退款。只有视频质量有问题时 视频和答疑同时退,不接受单独退款。
共14章148节视频,总学时1783分钟,合29.7小时。
主要内容包括:
深度强化学习算法教学顾
虑及重点基础知识复习,自带自定义函数创建车杆平衡控制问题环境,DQN算法
及其步骤与优缺点分析,DQN算法代码程序详解车杆平衡控制问题,DQN算法自带
函数程序再解车杆平衡控制问题,PG算法及其步骤与优缺点分析,PG算法自带函
数程序详解双积分系统控制问题,AC算法及其步骤与优缺点分析,AC算法自带函
数程序再解车杆平衡控制问题,DDPG算法及其步骤与优缺点分析,DDPG算法自带
函数程序再解双积分系统控制问题,连续状态离散动作问题用3个算法自编工具
箱函数程序实现控制,连续动作问题用DDPG算法自编工具箱函数程序实现控制。
全部免费提供MATLAB程序和PPT课件。
免费提供辅导答疑。
课程大纲
第一章 视频课程内容介绍及慎拍不拍说明与参考文献(29+39分钟)
1、先看全面讲解9个关键重点问题和店主预言先告必看第三版(25+4分钟)
2、DRL1_视频讲些什么及能干什么与程序演示结果(21分钟)
3、DRL2_MATLAB程序使用说明及亮点特点介绍(6分钟)
4、DRL3_慎拍不拍说明及学习基础要求与参考文献(12分钟)
第二章 深度强化学习算法教学顾虑及重点基础知识复习(89分钟)
5、DRL4_1教学顾虑与教学对策说明(7分钟)
6、DRL4_2复习BP神经网络层结构及工作流程(15分钟)
7、DRL4_3复习卷积神经网络五层关系及输出(7钟)
8、DRL4_4复习4个常用优化器公式及衰减因子知识(16分钟)
9、DRL4_5复习Q学习算法实施步骤及优缺点(14分钟)
10、DRL4_6复习策略迭代算法步骤及优缺点(16分钟)
11、DRL4_7复习值迭代算法步骤及优缺点与二者区别(14分钟)
第三章 自带自定义函数创建车杆平衡控制问题环境(139分钟)
12、DRL5_1学习目的及手推车杆平衡问题细说(13分钟,有程序)
13、DRL5_2MDP五要素与车杆平衡问题的对应分析(7分钟,有程序)
14、DRL5_3思考常用3个术语及其含义(6分钟,有程序)
15、DRL5_4自学程序及rlNum和rlFin函数功能(12分钟,有程序)
16、DRL5_5函数myResetFun功能详解(7分钟,有程序)
17、DRL5_6环境常量及平衡系统运动方程介绍(13分钟,有程序)
18、DRL5_7函数myStepFun语句详解(10分钟,有程序)
19、DRL5_8用自定义函数名得到下一记录信号(12分钟,有程序)
20、DRL5_9用函数句柄得到下一时刻记录信号(16分钟,有程序)
21、DRL5_10可改9处程序及其可改建议(11分钟,有程序)
22、DRL5_11参数设置及回合起始点详解(9分钟,有程序)
23、DRL5_12自定义函数联合应用程序详解(13分钟,有程序)
24、DRL5_13思考如何使用程序等4个问题及总结(10分钟,有程序)
第四章 DQN算法及其步骤与优缺点分析(115分钟)
25、DRL6_1DRL6_1学习目的及DQN算法的输入输出(12分钟)
26、DRL6_2DRL6_2研究存在问题及解决办法与经验回放(16分钟)
27、DRL6_3DRL6_3MNet和TNet及参数传递(8分钟)
28、DRL6_4DRL6_4DQN算法2013年版步骤详解(12分钟)
29、DRL6_5DRL6_5DQN2015版是否步骤详解(11分钟)
30、DRL6_6DRL6_6DQN算法三大改进思路及网址(6分钟)
31、DRL6_7DRL6_7论文与科研思路12点及总结(16分钟)
32、DRL6_8DRL6_8算法流程图及损失函数构造逻辑关系(13分钟)
33、DRL6_9DRL6_9创新点及优点与缺点介绍分析(8分钟)
34、DRL6_10DRL6_10思考DQN适用条件等问题及总结(13分钟)
第五章 DQN算法代码程序详解车杆平衡控制问题(380分钟)
35、DRL7_1学习目的及车杆平衡控制问题简介(12分钟)
36、DRL7_2自学建议及CPInit函数详解(10分钟,有程序)
37、DRL7_3AgInit和Reward函数详解(18分钟,有程序)
38、DRL7_4AgInit再详解及经验池初始化(12分钟,有程序)
39、DRL7_5CPReset函数详解及记录变量初始化(14分钟,有程序)
40、DRL7_6tcegre函数详解及得到Qmax和动作(15分钟,有程序)
41、DRL7_7CPEqs函数和ode45详解及新状态(15分钟,有程序)
42、DRL7_8PMove函数详解及各步训练过程分析(11分钟,有程序)
43、DRL7_9两网络复制及随机取训练样本(13分钟,有程序)
44、DRL7_10动作标号与400个状态整形(11分钟,有程序)
45、DRL7_11CalQtar详解及Q_target(12分钟,有程序)
46、DRL7_12主网络训练及回合终止条件(11分钟,有程序)
47、DRL7_13DQN算法步骤对应出现语句(15分钟,有程序)
48、DRL7_14程序7_1完整运行及结果解读分析(12分钟,有程序)
49、DRL7_15可改前面10处及其建议(15分钟,有程序)
50、DRL7_16可改后部10处及其建议(5分钟,有程序)
51、DRL7_17程序7_1结果4图像解读分析(14分钟,有程序)
52、DRL7_18原始程序7_1完整运行结果及3个方案(7分钟,有程序)
53、DRL7_19程序7_4小阈值及其结果分析(8分钟,有程序)
54、DRL7_20改动位置与角度正态奖励及结果分析(11分钟,有程序)
55、DRL7_21程序7_5改动关键及结果分析(15分钟,有程序)
56、DRL7_22程序7_6综合改动及其结果分析(14分钟,有程序)
57、DRL7_23结果5个对比及3个数值指标(14分钟,有程序)
58、DRL7_24回合控制时长及快速收敛数值指标(12分钟,有程序)
59、DRL7_25局部平稳性及持续控制回合数指标(9分钟,有程序)
60、DRL7_26完整回合与不完整回合及原因分析(20分钟,有程序)
61、DRL7_27模型扩展之6方面介绍(5分钟,有程序)
62、DRL7_28算法扩展之6点推荐介绍(5分钟,有程序)
63、DRL7_29思考状态动作和奖励及注意问题(7分钟,有程序)
64、DRL7_30思考两个网络关系及最终结果(12分钟,有程序)
65、DRL7_31思考贪婪策略阈值及奖惩关系(11分钟,有程序)
66、DRL7_32思考数值指标与使用程序及总结(15分钟,有程序)
第六章 DQN算法自带函数程序再解车杆平衡控制问题(133分钟)
67、DRL8_1学习目的及问题差别与自学建议(10分钟,有程序)
68、DRL8_2子函数rlPreEnv功能及自己问题引入(16分钟,有程序)
69、DRL8_3网络dnn结构及其含义分析(17分钟,有程序)
70、DRL8_4子函数critic及其可选参数设置(10分钟,有程序)
71、DRL8_5子函数rlDQNAg及其可选参数设置(14分钟,有程序)
72、DRL8_6train和sim过程详解分析(13分钟,有程序)
73、DRL8_7train过程动画详解与分析(11分钟,有程序)
74、DRL8_8可改7处及其可改建议(10分钟,有程序)
75、DRL8_9tranStats数据及论文用3图像分析(5分钟,有程序)
76、DRL8_10导入agent和env数据及图像分析(14分钟,有程序)
77、DRL8_11实际应用DQN结果的过程模拟(13分钟,有程序)
78、DRL8_12思考自带函数程序隐形输出2个问题(12分钟,有程序)
79、DRL8_13思考使用程序等4个问题及总结(15分钟,有程序)
第七章 PG算法及其步骤与优缺点分析(??分钟)
80、DRL9_1(6分钟,有程序)
81、DRL9_2(12分钟,有程序)
82、DRL9_3(8分钟,有程序)
83、DRL9_4(14分钟,有程序)
84、DRL9_5(9分钟,有程序)
85、DRL9_6(16分钟,有程序)
86、DRL9_7(16分钟,有程序)
第八章 PG算法自带函数程序详解双积分系统控制问题(??分钟)
87、DRL12_10(12分钟,有程序)
88、DRL12_11(14分钟,有程序)
89、DRL12_12(10分钟,有程序)
90、DRL12_13(8分钟,有程序)
91、DRL12_14(6分钟,有程序)
第九章 AC算法及其步骤与优缺点分析(??分钟)
92、DRL12_15(14分钟,有程序)
93、DRL12_16(13分钟,有程序)
94、DRL12_17(9分钟,有程序)
95、DRL12_18(6分钟,有程序)
96、DRL12_19(8分钟,有程序)
97、DRL12_20(9分钟,有程序)
98、DRL12_21(9分钟,有程序)
第十章 AC算法自带函数程序再解车杆平衡控制问题(??分钟)
99、DRL13_1(10分钟,有程序)
100、DRL13_2(17分钟,有程序)
101、DRL13_3(8分钟,有程序)
102、DRL13_4(16分钟,有程序)
103、DRL13_5(9分钟,有程序)
104、DRL13_6(8分钟,有程序)
105、DRL13_7(9分钟,有程序)
106、DRL13_8(14分钟,有程序)
第十一章 DDPG算法及其步骤与优缺点分析(??分钟)
107、DRL13_9(4分钟,有程序)
108、DRL13_10(5分钟,有程序)
109、DRL13_11(13分钟,有程序)
第十二章 DDPG算法自带函数程序再解双积分系统控制问题(??分钟)
110、DRL13_12(12分钟,有程序)
111、DRL13_13(16分钟,有程序)
五、下载文件
附件1_必先看_深度强化学习及程序视频学习指导.doc
附件2_深度强化学习与程序视频_PPT课件.rar
附件3_深度强化学习全部程序m_.rar