视频课程 人浏览 历史评分   更新时间: 30天前 随到随学

课程介绍

注意0:欲购买此课程,获取安全购买链接,索要正版授权学习平台账号,务必加咨询QQ:2536379620
注意1:由于编码原因,试听课程视频画面清晰度不如最终购买的视频。最终购买视频的画面清晰度可参见以下两张图。图1   图2
注意2:正版良心视频,购买后有机会和原作者直接短暂技术交流。               


本课程价格是视频加师傅带徒弟保姆式答疑。只需视频 ,无需答疑者勿拍 。(纯视频不单卖,以此为理由不接受退款)答疑和视频分别付款。因为有人会单独购买答疑辅导部分。答 疑部分不允许单独退款。只有视频质量有问题时 视频和答疑同时退,不接受单独退款。


共14章148节视频,总学时1783分钟,合29.7小时。

主要内容包括:
深度强化学习算法教学顾
虑及重点基础知识复习,自带自定义函数创建车杆平衡控制问题环境,DQN算法
及其步骤与优缺点分析,DQN算法代码程序详解车杆平衡控制问题,DQN算法自带
函数程序再解车杆平衡控制问题,PG算法及其步骤与优缺点分析,PG算法自带函
数程序详解双积分系统控制问题,AC算法及其步骤与优缺点分析,AC算法自带函
数程序再解车杆平衡控制问题,DDPG算法及其步骤与优缺点分析,DDPG算法自带
函数程序再解双积分系统控制问题,连续状态离散动作问题用3个算法自编工具
箱函数程序实现控制,连续动作问题用DDPG算法自编工具箱函数程序实现控制。

全部免费提供MATLAB程序和PPT课件。

免费提供辅导答疑。

课程大纲

第一章 视频课程内容介绍及慎拍不拍说明与参考文献(29+39分钟)

1、先看全面讲解9个关键重点问题和店主预言先告必看第三版(25+4分钟)

2、DRL1_视频讲些什么及能干什么与程序演示结果(21分钟)

3、DRL2_MATLAB程序使用说明及亮点特点介绍(6分钟)

4、DRL3_慎拍不拍说明及学习基础要求与参考文献(12分钟)

第二章 深度强化学习算法教学顾虑及重点基础知识复习(89分钟)

5、DRL4_1教学顾虑与教学对策说明(7分钟)

6、DRL4_2复习BP神经网络层结构及工作流程(15分钟)

7、DRL4_3复习卷积神经网络五层关系及输出(7钟)

8、DRL4_4复习4个常用优化器公式及衰减因子知识(16分钟)

9、DRL4_5复习Q学习算法实施步骤及优缺点(14分钟)

10、DRL4_6复习策略迭代算法步骤及优缺点(16分钟)

11、DRL4_7复习值迭代算法步骤及优缺点与二者区别(14分钟)

第三章 自带自定义函数创建车杆平衡控制问题环境(139分钟)

12、DRL5_1学习目的及手推车杆平衡问题细说(13分钟,有程序)

13、DRL5_2MDP五要素与车杆平衡问题的对应分析(7分钟,有程序)

14、DRL5_3思考常用3个术语及其含义(6分钟,有程序)

15、DRL5_4自学程序及rlNum和rlFin函数功能(12分钟,有程序)

16、DRL5_5函数myResetFun功能详解(7分钟,有程序)

17、DRL5_6环境常量及平衡系统运动方程介绍(13分钟,有程序)

18、DRL5_7函数myStepFun语句详解(10分钟,有程序)

19、DRL5_8用自定义函数名得到下一记录信号(12分钟,有程序)

20、DRL5_9用函数句柄得到下一时刻记录信号(16分钟,有程序)

21、DRL5_10可改9处程序及其可改建议(11分钟,有程序)

22、DRL5_11参数设置及回合起始点详解(9分钟,有程序)

23、DRL5_12自定义函数联合应用程序详解(13分钟,有程序)

24、DRL5_13思考如何使用程序等4个问题及总结(10分钟,有程序)

第四章 DQN算法及其步骤与优缺点分析(115分钟)

25、DRL6_1DRL6_1学习目的及DQN算法的输入输出(12分钟)

26、DRL6_2DRL6_2研究存在问题及解决办法与经验回放(16分钟)

27、DRL6_3DRL6_3MNet和TNet及参数传递(8分钟)

28、DRL6_4DRL6_4DQN算法2013年版步骤详解(12分钟)

29、DRL6_5DRL6_5DQN2015版是否步骤详解(11分钟)

30、DRL6_6DRL6_6DQN算法三大改进思路及网址(6分钟)

31、DRL6_7DRL6_7论文与科研思路12点及总结(16分钟)

32、DRL6_8DRL6_8算法流程图及损失函数构造逻辑关系(13分钟)

33、DRL6_9DRL6_9创新点及优点与缺点介绍分析(8分钟)

34、DRL6_10DRL6_10思考DQN适用条件等问题及总结(13分钟)

第五章 DQN算法代码程序详解车杆平衡控制问题(380分钟)

35、DRL7_1学习目的及车杆平衡控制问题简介(12分钟)

36、DRL7_2自学建议及CPInit函数详解(10分钟,有程序)

37、DRL7_3AgInit和Reward函数详解(18分钟,有程序)

38、DRL7_4AgInit再详解及经验池初始化(12分钟,有程序)

39、DRL7_5CPReset函数详解及记录变量初始化(14分钟,有程序)

40、DRL7_6tcegre函数详解及得到Qmax和动作(15分钟,有程序)

41、DRL7_7CPEqs函数和ode45详解及新状态(15分钟,有程序)

42、DRL7_8PMove函数详解及各步训练过程分析(11分钟,有程序)

43、DRL7_9两网络复制及随机取训练样本(13分钟,有程序)

44、DRL7_10动作标号与400个状态整形(11分钟,有程序)

45、DRL7_11CalQtar详解及Q_target(12分钟,有程序)

46、DRL7_12主网络训练及回合终止条件(11分钟,有程序)

47、DRL7_13DQN算法步骤对应出现语句(15分钟,有程序)

48、DRL7_14程序7_1完整运行及结果解读分析(12分钟,有程序)

49、DRL7_15可改前面10处及其建议(15分钟,有程序)

50、DRL7_16可改后部10处及其建议(5分钟,有程序)

51、DRL7_17程序7_1结果4图像解读分析(14分钟,有程序)

52、DRL7_18原始程序7_1完整运行结果及3个方案(7分钟,有程序)

53、DRL7_19程序7_4小阈值及其结果分析(8分钟,有程序)

54、DRL7_20改动位置与角度正态奖励及结果分析(11分钟,有程序)

55、DRL7_21程序7_5改动关键及结果分析(15分钟,有程序)

56、DRL7_22程序7_6综合改动及其结果分析(14分钟,有程序)

57、DRL7_23结果5个对比及3个数值指标(14分钟,有程序)

58、DRL7_24回合控制时长及快速收敛数值指标(12分钟,有程序)

59、DRL7_25局部平稳性及持续控制回合数指标(9分钟,有程序)

60、DRL7_26完整回合与不完整回合及原因分析(20分钟,有程序)

61、DRL7_27模型扩展之6方面介绍(5分钟,有程序)

62、DRL7_28算法扩展之6点推荐介绍(5分钟,有程序)

63、DRL7_29思考状态动作和奖励及注意问题(7分钟,有程序)

64、DRL7_30思考两个网络关系及最终结果(12分钟,有程序)

65、DRL7_31思考贪婪策略阈值及奖惩关系(11分钟,有程序)

66、DRL7_32思考数值指标与使用程序及总结(15分钟,有程序)

第六章 DQN算法自带函数程序再解车杆平衡控制问题(133分钟)

67、DRL8_1学习目的及问题差别与自学建议(10分钟,有程序)

68、DRL8_2子函数rlPreEnv功能及自己问题引入(16分钟,有程序)

69、DRL8_3网络dnn结构及其含义分析(17分钟,有程序)

70、DRL8_4子函数critic及其可选参数设置(10分钟,有程序)

71、DRL8_5子函数rlDQNAg及其可选参数设置(14分钟,有程序)

72、DRL8_6train和sim过程详解分析(13分钟,有程序)

73、DRL8_7train过程动画详解与分析(11分钟,有程序)

74、DRL8_8可改7处及其可改建议(10分钟,有程序)

75、DRL8_9tranStats数据及论文用3图像分析(5分钟,有程序)

76、DRL8_10导入agent和env数据及图像分析(14分钟,有程序)

77、DRL8_11实际应用DQN结果的过程模拟(13分钟,有程序)

78、DRL8_12思考自带函数程序隐形输出2个问题(12分钟,有程序)

79、DRL8_13思考使用程序等4个问题及总结(15分钟,有程序)

第七章 PG算法及其步骤与优缺点分析(??分钟)

80、DRL9_1(6分钟,有程序)

81、DRL9_2(12分钟,有程序)

82、DRL9_3(8分钟,有程序)

83、DRL9_4(14分钟,有程序)

84、DRL9_5(9分钟,有程序)

85、DRL9_6(16分钟,有程序)

86、DRL9_7(16分钟,有程序)

第八章 PG算法自带函数程序详解双积分系统控制问题(??分钟)

87、DRL12_10(12分钟,有程序)

88、DRL12_11(14分钟,有程序)

89、DRL12_12(10分钟,有程序)

90、DRL12_13(8分钟,有程序)

91、DRL12_14(6分钟,有程序)

第九章 AC算法及其步骤与优缺点分析(??分钟)

92、DRL12_15(14分钟,有程序)

93、DRL12_16(13分钟,有程序)

94、DRL12_17(9分钟,有程序)

95、DRL12_18(6分钟,有程序)

96、DRL12_19(8分钟,有程序)

97、DRL12_20(9分钟,有程序)

98、DRL12_21(9分钟,有程序)

第十章 AC算法自带函数程序再解车杆平衡控制问题(??分钟)

99、DRL13_1(10分钟,有程序)

100、DRL13_2(17分钟,有程序)

101、DRL13_3(8分钟,有程序)

102、DRL13_4(16分钟,有程序)

103、DRL13_5(9分钟,有程序)

104、DRL13_6(8分钟,有程序)

105、DRL13_7(9分钟,有程序)

106、DRL13_8(14分钟,有程序)

第十一章 DDPG算法及其步骤与优缺点分析(??分钟)

107、DRL13_9(4分钟,有程序)

108、DRL13_10(5分钟,有程序)

109、DRL13_11(13分钟,有程序)

第十二章 DDPG算法自带函数程序再解双积分系统控制问题(??分钟)

110、DRL13_12(12分钟,有程序)

111、DRL13_13(16分钟,有程序)

五、下载文件

附件1_必先看_深度强化学习及程序视频学习指导.doc

附件2_深度强化学习与程序视频_PPT课件.rar

附件3_深度强化学习全部程序m_.rar
相关推荐
客服 关于