课程分类

课程介绍
课程目录
用户评论
课程介绍
课程目录
用户评论

你将获得

  • 掌握某些知识点
  • 学会某些技巧(或思路)

教学服务

  • icon

    1v1专属答疑服务

  • icon

    BAT专家面试辅导

讲师介绍

  • 《Simulink仿真及代码生成技术入门到精通》一书作者。MathWorks官方中文论坛超级版主,帮助会员解答数千MATLAB/Simulink问题,解决MBD流程痛点。资深ADAS驾驶辅助系统集成与软件设计专家,申请发明专利21件,其中3件已授权。为电控产品从业者专业打造MBD全栈个人成长方案。

  • 课程详情

    时代发展越来越快,电子软件工程师从最早的单片机,到MBD软件设计,AutoSARS架构,ISO26262功能安全再转移到自动驾驶的感知、决策与控制,也仅仅用了十年左右的时间。如今AI的产品化逐渐普及,在电控方向引入人工智能已成为必然,此门课程帮助电子软件工程师迅速转型,以适应时代发展的势头,并尽快抓住走向未来的机会。
    强化学习算法与实现分为十节课,每节课注重解决一个重点数学理论问题,并附带例题和代码实现,所讲内容讲义和代码随后都将在课程中开放下载。
    基本目录如下:

    强化学习基础
      ○马尔科夫决策过程
      ○贝尔曼方程,贝尔曼期待方程,贝尔曼优化方程
      ○
    策略评估与策略改进
      ○值函数V迭代与策略函数π迭代以及二者区别
      ○蒙特卡洛学习方法
      ○Q Learning


      ○时序差分学习TD Learning
      ○On Policy VS Off Policy
      ○Explore and Exploite

    ●强化学习简介
      ○强化学习架构(环境,代理,决策,状态与动作,迁移与奖励)
      ○强化学习算法分类(Value based, Policy Based, Actor-Critic)
      ○强化学习训练过程(
    Q Learning, Sarsa, DQN, REINFORCE等)
      ○强化学习示例(AI走迷宫, Cart-Pole, 自动驾驶汽车)

    ● 算法及实例
             训练代理规划路径通过《Windy Grid World》

             训练代理学习《打壁球》游戏
             训练代理在连续环境中平衡Cart-Pole
              使用形式化建模方式实现Agent与环境的互动及学习


     
    丰富实例: 21点游戏策略评估

    训练AI通过《Windy Grid World》:

    训练AI打壁球游戏:


    训练AI小车平衡竖杆:

    使用Simulink实现Agent与环境的互动与学习
    温馨提示
    • 请勿私下交易
      请勿在平台外交易。与机构和老师私下交易造成的任何损失及纠纷,腾讯课堂不承担任何责任
    • 听课说明

      1、电脑:访问腾讯课堂官网 ke.qq.com 查看我的课表或下载win/mac客户端听课

      2、手机/平板:下载腾讯课堂APP, 进入学习页面听课