“松雅智汇”学术讲座第二期

April 22, 2026

迈向具身决策智能: 强化学习算法与基础设施协同演进

随着人工智能从数字空间走向物理世界，具身智能正成为推动智能系统落地应用的关键范式。然而，现有方法多沿用以模型为中心的离线训练路径，缺乏对真实环境中“感知一决策一执行”闭环的系统性支持，导致策略泛化能力受限、真实部署成本高昂。为应对这一挑战，强化学习(Reinforcement Learning,RL)被视为实现具身决策智能的核心技术.但其在真实场景中的应用仍受制于算法效率、系统扩展性与软硬件协同不足等瓶颈。本文围绕“强化学习算法与基础设施协同演进”的核心思想，系统性介绍RLinf框架及其在具身智能中的探索。

时间:2026年4月22日(周三)14:00

线上地点:腾讯会议:984-838-194

线下地点:松雅湖人工智能创新中心第二会议室204