3月4日,蚂蚁集团联合清华大学推出开源强化学习训练框架AReaL v1.0稳定版,实现智能体一键接入强化学习,无需改代码即可兼容各类Agent框架,让强化学习训练开箱即用。该系统采用全异步训推解耦架构,可在真实任务中收集反馈,推动智能体持续优化决策。以OpenClaw为例,开发者只需在配置中修改接口地址即可实现RL训练接入,智能体在执行任务过程中能自动进化。
AReaL v1.0同时发布原生训练引擎Archon,基于PyTorch实现5D并行(数据、流水线、张量、上下文、专家),支持千亿参数MoE模型训练,仅用1人月完成开发。系统集成AI辅助开发体系,提供从规划到编码、校验、PR创建的全链路支持,大幅提升复杂工程效率。团队表示将持续改进训练引擎及多模态智能体能力,项目代码与文档已在inclusionAI社区开源。