0
点赞
收藏
分享

微信扫一扫

【深度强化学习PID】基于深度强化学习的PID控制器simulink仿真


1.软件版本

MATLAB2019a

2.本算法理论知识

具体参考如下的文献:

【深度强化学习PID】基于深度强化学习的PID控制器simulink仿真_simulink

我们的强化学习控制结构如下图所示:

【深度强化学习PID】基于深度强化学习的PID控制器simulink仿真_PID_02

 评价函数设计:

【深度强化学习PID】基于深度强化学习的PID控制器simulink仿真_simulink_03

参数调整法则设计:

【深度强化学习PID】基于深度强化学习的PID控制器simulink仿真_PID_04

我们这里的规则如下:

y     = alpha*(1-Vt);

因为论文的研究方法,我们测试返现,如果前后调整量Pt不变或者很小的时候,会导致deltaP极大,从而破坏算法的稳定性。

然后我们是分别对P和I,和D进行调整,

【深度强化学习PID】基于深度强化学习的PID控制器simulink仿真_PID_05

       也就是对应模型中的5个调整模块,但是在本课题中仿佛这种五级效果范围不好,我这里设置alpha为1,那么本质上就是三级。对应的模型我没删除,放在原来模型中,供你参考。

决策机制:

【深度强化学习PID】基于深度强化学习的PID控制器simulink仿真_PID_06

 3.核心代码

【深度强化学习PID】基于深度强化学习的PID控制器simulink仿真_深度强化学习_07

【深度强化学习PID】基于深度强化学习的PID控制器simulink仿真_深度强化学习_08

4.操作步骤与仿真结论

【深度强化学习PID】基于深度强化学习的PID控制器simulink仿真_simulink_09

 

【深度强化学习PID】基于深度强化学习的PID控制器simulink仿真_强化学习_10

 

然后RL的学习过程如下:

【深度强化学习PID】基于深度强化学习的PID控制器simulink仿真_强化学习_11

【深度强化学习PID】基于深度强化学习的PID控制器simulink仿真_强化学习_12

5.参考文献

[1]高瑞娟, 吴梅. 基于改进强化学习的PID参数整定原理及应用[J]. 现代电子技术, 2014, 37(4):4.A05-66

举报

相关推荐

0 条评论