0
点赞
收藏
分享

微信扫一扫

《Reward is enough》 论文阅读


摘要

本文提出假说,Reward is enough for AGI

引言

举了松鼠找松子吃的例子,确实,最终吃了松子reward就为1,没吃到松子reward就为0

背景知识:强化学习

把世界和生活的所有事reward化:

《Reward is enough》 论文阅读_深度学习

讨论

尝试用强化学习解释世界的一切robot

结论

如果Reward-is-enough这个猜想是正确的,就能实现AGI。


举报

相关推荐

0 条评论