Corax: Core RL in JAX:JAX强化学习算法库

它旨在为 RL 算法提供模块化、纯功能性组件,可以轻松地用于不同的训练循环和加速器配置。目标是提供强大的基线代理,可以为未来的强化学习研究进行分叉和定制。
 
 
Back to Top