特点

1. 可复现性保证

我们提供了高质量的主流强化学习算法实现,严格地复现了论文对应的指标。

2. 大规模并行支持

框架最高可支持上万个CPU的同时并发计算,并且支持多GPU强化学习模型的训练。

3. 可复用性强

用户无需自己重新实现算法,通过复用框架提供的算法可以轻松地把经典强化学习算法应用到具体的场景中。

4. 良好扩展性

当用户想调研新的算法时,可以通过继承我们提供的基类可以快速实现自己的强化学习算法。