Embodied Decision Intelligence Lab (EDI Lab) 清华大学具身决策智能实验室

RLinf入选2025 EAI 十大突破性成果

十大突破性成果是具身智能领域年度核心技术标杆,涵盖世界模型、具身大模型、运动控制、医疗应用等关键方向。这些成果均达到国际领先水平,突破了传统技术瓶颈,从基础算法优化、模型架构创新到产业落地适配,全方位推动具身智能技术升级,为行业发展提供全新技术路径,加速技术从实验室走向规模化应用。

清华大学 — RLinf 强化学习后训练框架

RLinf 强化学习后训练框架推出面向流匹配VLA模型的在线强化学习微调框架πRL,提出Flow-Noise和Flow-SDE两种微调方案,在公开测试平台LIBERO达到平均97.6%和98.3%的成功率。首次将R1类强化学习用于VLA模型,大幅提升机器人在复杂操作中的学习效率与泛化能力,为具身模型真机在线优化提供了全新技术路线。

Next post
智源社区ICLR 2026 预讲会