OpenClaw能“边用边训”了：智能体强化学习训练框架AReaL v1.0稳定版发布

3月4日，蚂蚁集团联合清华大学推出开源强化学习训练框架AReaL v1.0稳定版，实现智能体一键接入强化学习，无需改代码即可兼容各类Agent框架，让强化学习训练开箱即用。该系统采用全异步训推解耦架构，可在真实任务中收集反馈，推动智能体持续优化决策。以OpenClaw为例，开发者只需在配置中修改接口地址即可实现RL训练接入，智能体在执行任务过程中能自动进化。
AReaL v1.0同时发布原生训练引擎Archon，基于PyTorch实现5D并行（数据、流水线、张量、上下文、专家），支持千亿参数MoE模型训练，仅用1人月完成开发。系统集成AI辅助开发体系，提供从规划到编码、校验、PR创建的全链路支持，大幅提升复杂工程效率。团队表示将持续改进训练引擎及多模态智能体能力，项目代码与文档已在inclusionAI社区开源。

OpenClaw能“边用边训”了：智能体强化学习训练框架AReaL v1.0稳定版发布

发表回复