0

点赞

收藏

分享

IRGAN里REINFORCE算法的推导过程的理解方式

小猪肥 2022-07-27 阅读 31

标签: 神经网络 sed github OpenStack 云计算

IRGAN里REINFORCE算法的推导过程的理解方式_神经网络

IRGAN里的上面这个推导用了policy gradient based reinforcement learning (REINFORCE)算法，看了这个博客才看懂每步推导过程 http://karpathy.github.io/2016/05/31/rl/

IRGAN里REINFORCE算法的推导过程的理解方式_github_02

上面是从karpathy的博客摘的另外θ可以理解为神经网络的参数

IRGAN里REINFORCE算法的推导过程的理解方式_github_03

0 条评论

关注