专为大型语言模型提供高级推理能力的开源框架,支持数据生成、策略训练和多种搜索策略,让机器更聪明地理解和解决问题,提供了 MATH-APS 数据集和 MATH-psa 流程奖励模型,并且支持多种推理和训练方法

OpenR | #框架
 
 
Back to Top