人工智能培训专家讲师深度学习讲师机器学习讲师叶梓个人简历(AI培训人工智能培训人工智能专家ai讲师

标签:
人工智能讲师机器学习讲师深度学习讲师人工智能培训人工智能专家 |
分类: 大数据人工智能 |
ü
ü
ü
ü
助理QQ:526346584
v
ü
ü
ü
ü
ü
ü
ü
ü
ü
ü
ü
ü
ü
ü
ü
ü
ü
……加助理QQ详细沟通,大数据人工智能讲师的全部课程介绍及培训简历
此照片为人工智能机器学习深度学习大数据培训讲师叶梓在给南京晓庄学员大数据人工智能深度学习专业的老师进行为期4天的师资培训。
此照片为人工智能机器学习深度学习大数据培训讲师叶梓在为某政府机构进行大数据人工智能宣讲
此照片为人工智能机器学习深度学习大数据培训讲师叶梓在为全国优秀师资及学员进行“机器学习与深度学习实践”培训
人工智能讲师叶梓之《强化学习与深度学习》
第一天 强化学习
第一课 强化学习综述
1.强化学习要解决的问题
2.强化学习方法的分类
3.强化学习方法的发展趋势
4.环境搭建实验(Gym,TensorFlow等)
5.Gym环境的基本使用方法
第二课 马尔科夫决策过程
1.基本概念:马尔科夫性、马尔科夫过程、马尔科夫决策过程
2.MDP基本元素:策略、回报、值函数、状态行为值函数
3.贝尔曼方程
4.最优策略
案例:构建机器人找金币和迷宫的环境
第三课 基于模型的动态规划方法
1.动态规划概念介绍
2.策略评估过程介绍
3.策略改进方法介绍
4.策略迭代和值迭代
案例:实现基于模型的强化学习算法
第四课 蒙特卡罗方法
1.蒙特卡罗策略评估
2.蒙特卡罗策略改进
3.基于蒙特卡罗的强化学习
4.同策略和异策略
案例:利用蒙特卡罗方法实现机器人找金币和迷宫
第五课 时序差分方法
1.DP,MC和TD方法比较
2.MC和TD方法偏差与方差平衡
3.同策略TD方法:Sarsa 方法
4.异策略TD方法:Q-learning 方法
案例:Q-learning和Sarsa的实现
第二天 深度学习
第一课 BP神经网络
1.人工神经元及感知机模型
2.前向神经网络
3.sigmoid
4.径向基函数神经网络
5.误差反向传播
案例:可手算的神经网络
第二课 深度学习基础知识
1.连接主义的兴衰
2.深度学习与神经网络的区别与联系
3.目标函数
4.激励函数
5.学习步长
6.Adagrad\RMSprop\Adam
7.避免过适应
案例:深度学习实现的手写数字识别
第三课 用于分类的CNN
1.CNN分类典型应用场景
2.Alexnet
3.VGG
4.Gooolenet
5.Resnet
案例:VGG的finetune
第四课 用于目标检测的CNN
1.CNN目标检测典型应用场景
2.RCNN
3.Fast/faster RCNN
案例:目标检测的实用效果
第五课 RNN
1.基本RNN
2.LSTM
3.GRU
案例:基于RNN的股价预测
第三天 深度学习与强化学习的结合
第一课GAN(深度学习)
1.VAE与基本GAN
2.DCGAN
3.WGAN
案例:生成手写数字的GAN
第二课 基于值函数逼近方法(深度学习与强化学习的结合)
1.值函数的参数化表示
2.值函数的估计过程
3.深度学习与强化学习的结合
4.DQN 方法介绍
5.DQN变种:Double DQN, Prioritized Replay, Dueling Network
案例:用DQN玩游戏——flappy bird
第三课 策略梯度方法(强化学习进阶)
1.策略梯度方法介绍
2.常见的策略表示
3.常见的减小方差的方法:引入基函数法,修改估计值函数法
案例:利用gym和tensorflow实现小车倒立摆系统等
第四课Alpha Go(深度学习与强化学习的结合)
1.MCTS
2.策略网络与价值网络
3.Alpha Go的完整架构
第五课 多Agent强化学习(深度学习与强化学习的结合)
1.矩阵博弈
2.纳什均衡
3.多人随机博弈学习
4.完全合作、完全竞争与混合任务
5.MADDPG