0
点赞
收藏
分享

微信扫一扫

LEARNING TO NAVIGATE IN COMPLEX ENVIRONMENTS

书呆鱼 2022-07-18 阅读 52

任务是地图里面导航,让agent从起始点到达指定位置。

 

用了supervised learning + reinforcement learning + lstm

 

用supervised learning当做辅助训练,加速rl训练,用lstm当做memory。实验表明depth construction比较有用。论文中的方法在固定地图和随机地图中都能用。

 

黄世宇/Shiyu Huang's Personal Page:​​https://huangshiyu13.github.io/​​



举报

相关推荐

0 条评论