黑洞资源笔记

Q-Transformer ：DeepMind开发的一种新的强化学习方法，它的目标是从大量的数据中学习如何完成多种任务。（工作原理见评）

该方法可以处理大量的数据，并且可以从人类的示范中学习。这意味着，如果有一个人类专家展示如何完成任务，Q-Transformer可以从这些示范中学习。

Q-Transformer 可以应用于各种需要决策学习的领域，如机器人控制、游戏策略优化、金融决策等。

项目及演示 | paper

qt_animation.gif

13.1 MB