你将获得

掌握某些知识点
学会某些技巧（或思路）

教学服务

1v1专属答疑服务
BAT专家面试辅导

讲师介绍

Hyowinner

校长

《Simulink仿真及代码生成技术入门到精通》一书作者。MathWorks官方中文论坛超级版主，帮助会员解答数千MATLAB/Simulink问题，解决MBD流程痛点。资深ADAS驾驶辅助系统集成与软件设计专家，申请发明专利21件，其中3件已授权。为电控产品从业者专业打造MBD全栈个人成长方案。

课程详情

时代发展越来越快，电子软件工程师从最早的单片机，到MBD软件设计，AutoSARS架构，ISO26262功能安全再转移到自动驾驶的感知、决策与控制，也仅仅用了十年左右的时间。如今AI的产品化逐渐普及，在电控方向引入人工智能已成为必然，此门课程帮助电子软件工程师迅速转型，以适应时代发展的势头，并尽快抓住走向未来的机会。
强化学习算法与实现分为十节课，每节课注重解决一个重点数学理论问题，并附带例题和代码实现，所讲内容讲义和代码随后都将在课程中开放下载。
基本目录如下：
●强化学习基础
○马尔科夫决策过程
○贝尔曼方程，贝尔曼期待方程，贝尔曼优化方程
○策略评估与策略改进
○值函数V迭代与策略函数π迭代以及二者区别
○蒙特卡洛学习方法
○Q Learning

○时序差分学习TD Learning
○On Policy VS Off Policy
○Explore and Exploite

●强化学习简介
○强化学习架构(环境，代理，决策，状态与动作，迁移与奖励)
○强化学习算法分类(Value based, Policy Based, Actor-Critic)
○强化学习训练过程(Q Learning, Sarsa, DQN, REINFORCE等)
○强化学习示例(AI走迷宫, Cart-Pole, 自动驾驶汽车)

● 算法及实例
         训练代理规划路径通过《Windy Grid World》
         训练代理学习《打壁球》游戏
         训练代理在连续环境中平衡Cart-Pole
使用形式化建模方式实现Agent与环境的互动及学习

丰富实例： 21点游戏策略评估

训练AI通过《Windy Grid World》：

训练AI打壁球游戏：

训练AI小车平衡竖杆：

使用Simulink实现Agent与环境的互动与学习

暂无课程目录～

暂无用户评论～

温馨提示

请勿私下交易
请勿在平台外交易。与机构和老师私下交易造成的任何损失及纠纷，腾讯课堂不承担任何责任
听课说明
1、电脑：访问腾讯课堂官网 ke.qq.com 查看我的课表或下载win/mac客户端听课
2、手机/平板：下载腾讯课堂APP, 进入学习页面听课