导读 基于模型的强化学习(RL) 帮助机器人学习技能。Agent 获得了一个预测模型,该模型代表了世界如何运作并得出有效的策略。但是,在复杂环境(
基于模型的强化学习(RL) 帮助机器人学习技能。Agent 获得了一个预测模型,该模型代表了世界如何运作并得出有效的策略。但是,在复杂环境(例如图像)的情况下会出现挑战。
最近发表在 arXiv.org 上的一篇论文试图设计一种非重构表示学习方法,该方法明确优先考虑最有可能与代理功能相关的信息。
研究人员通过互信息最大化和授权将表示学习相结合,推导出基于模型的 RL 算法。基于授权的术语可以对最有可能具有功能相关性的信息进行优先排序。
这种方法显着提高了存在时间相关干扰物(例如,背景视频)的性能,并在奖励信号较弱时加速了环境中的探索。
版权声明:本文由用户上传,如有侵权请联系删除!