Q-Transformer :DeepMind开发的一种新的强化学习方法,它的目标是从大量的数据中学习如何完成多种任务。(工作原理见评)

该方法可以处理大量的数据,并且可以从人类的示范中学习。这意味着,如果有一个人类专家展示如何完成任务,Q-Transformer可以从这些示范中学习。

Q-Transformer 可以应用于各种需要决策学习的领域,如机器人控制、游戏策略优化、金融决策等。

项目及演示 | paper
qt_animation.gif
13.1 MB
 
 
Back to Top