专为大型语言模型提供高级推理能力的开源框架，支持数据生成、策略训练和多种搜索策略，让机器更聪明地理解和解决问题，提供了 MATH-APS 数据集和 MATH-psa 流程奖励模型，并且支持多种推理和训练方法OpenR | #框架 | 黑洞资源笔记

15:17 · Oct 13, 2024 · Sun

专为大型语言模型提供高级推理能力的开源框架，支持数据生成、策略训练和多种搜索策略，让机器更聪明地理解和解决问题，提供了 MATH-APS 数据集和 MATH-psa 流程奖励模型，并且支持多种推理和训练方法

OpenR | #框架