Skip to content

最优控制碎碎念

欢迎来到「最优控制碎碎念」系列!本系列融合施凌老师的 协同感知、Zachary Manchester 的 最优控制、高飞老师的 轨迹规划 以及 Pieter Abbeel 的 深度强化学习 等课程精华,通过严谨的数学推导,构建一个从经典控制到现代强化学习的完整知识体系。我们将从最优感知与控制的基础理论出发,系统探讨模型预测控制、轨迹规划等核心主题,并深入解析深度强化学习在控制领域的前沿进展。

1. 最优状态估计

  1. 系统能控性与能观性
  2. 最优估计的准则
  3. 递推贝叶斯滤波框架
  4. 卡尔曼滤波器实现
  5. 扩展卡尔曼滤波器
  6. 无迹卡尔曼滤波器
  7. 粒子滤波器

2. 最优控制基础

  1. 最优控制导论
  2. 基于极值原理的解析解
  3. 基于动态规划的数值解
  4. LQR 的变分法推导
  5. LQR 的凸优化形式化
  6. Riccati 方程的性质与求解
  7. 控制与滤波的对称美

3. 模型预测控制

4. 轨迹规划与优化

5. 强化学习基础

6. 深度强化学习

7. 其他前沿方向

Comments