“松雅智汇”学术讲座第二期
April 22, 2026
迈向具身决策智能: 强化学习算法与基础设施协同演进
随着人工智能从数字空间走向物理世界,具身智能正成为推动智能系统落地应用的关键范式。然而,现有方法多沿用以模型为中心的离线训练路径,缺乏对真实环境中“感知一决策一执行”闭环的系统性支持,导致策略泛化能力受限、真实部署成本高昂。为应对这一挑战,强化学习(Reinforcement Learning,RL)被视为实现具身决策智能的核心技术.但其在真实场景中的应用仍受制于算法效率、系统扩展性与软硬件协同不足等瓶颈。本文围绕“强化学习算法与基础设施协同演进”的核心思想,系统性介绍RLinf框架及其在具身智能中的探索。
时间:2026年4月22日(周三)14:00
线上地点:腾讯会议:984-838-194
线下地点:松雅湖人工智能创新中心第二会议室204
