方班前沿秀第四十一期:同济大学申恒涛教授作“面向空间、任务、本体无界的空间智能”的主题报告
2025年12月18日,广州大学网络空间安全学院“方滨兴院士班”(方班)2025级学子们齐聚广州大学黄埔校区B1-109报告厅,参加本学期“方班前沿秀”学术报告。本次报告邀请到同济大学计算机科学与技术学院院长申恒涛教授作主题分享,报告题为“面向空间、任务、本体无界的空间智能”。申教授以清晰的脉络、鲜活的例子与前沿研究进展,为同学们呈现了空间智能的关键问题、技术路径与未来趋势。

报告从“空间智能为何在近一年多迅速升温”切入,指出当前AI在工业制造、机器人等典型物理场景中仍面临两类核心挑战:一方面,传统大模型更擅长处理语言与视觉等“数字世界”信息,但难以在真实物理世界中输出高频、精确的控制指令;另一方面,现实系统存在显著的任务与设备碎片化——不同机器人、不同任务之间模型难以迁移,导致效率偏低、成本偏高。由此,申教授强调:面向真实世界的下一代智能,需要从“能看、能说”迈向“能理解、能规划、能执行”,而空间智能正是通往这一目标的重要一环。

围绕“空间智能是什么、要解决什么、怎么做”三个问题,申教授逐步展开论述。他引导同学们思考:如果让机器在物理世界完成任务,仅靠识别与生成远远不够,还必须理解空间中的结构关系与物理世界的机理与因果,能够解释“为什么会这样”、预测“接下来会怎样”,并据此进行规划与协同执行。报告中,申教授将空间智能放在更宏观的智能演进脉络中进行对比分析:从偏“被动感知”的阶段,走向以交互为核心、强调预测与行动闭环的阶段;其中,“世界模型”被视为支撑智能体理解与预测物理动态的关键抓手。紧扣题目中的“三个无界”,报告进一步给出了面向AGI与具身智能的目标刻画与技术框架:

在实现路径上,申教授结合团队探索介绍了若干关键环节:其一是以统一表征为核心,尝试把多源信息(尤其是空间相关信息)纳入同一表示框架中,并提到团队曾以“无界1.0”等探索为起点推进统一表示的研究;其二是强调“高层意图/指令”与“具身控制指令”的对齐问题,即让“会推理的大脑”与“会控制的小脑”能够协同工作,支撑VLA(视觉-语言-动作)式的端到端闭环;其三是数据与训练范式层面,报告提到基于物理规律一致性的模拟/合成数据与相关数据工厂思路对于世界模型学习与具身训练的重要性。申教授也坦诚指出:统一表征的理论体系、连续与离散信息的融合机制、以及真正“可靠地理解物理规律”的框架仍在快速演进中,仍需要更多基础研究突破。
然后,申教授对报告内容进行了回顾梳理,强调空间智能的核心不只是“看见空间”,更是“在空间中理解、预测并完成任务”。在报告的结尾,申教授与方班同学们进行了交流,就同学们关心的研究切入点、数据与评测、模型泛化等问题逐一回应,现场讨论热烈。

申教授总结了整个讲座内容,梳理了从研究动机到挑战,再根据挑战讲解了具体研究,也提出了一些展望,涉及超大规模协作、动态开放环境协作、非合作环境下可引导协作、群体智能安全与隐私保护等。申教授精彩的讲解,赢得在座师生阵阵热烈的掌声。本次“方班前沿秀”在浓厚的学术氛围中圆满落幕。同学们表示,他们通过本次报告对空间智能的研究动机、关键挑战与技术路线有了更系统的认识,也对面向真实世界的智能体发展方向产生了更深入的思考与期待。第四十一期方班前沿秀报告圆满落幕。
整理:孙维政 韦玉娟
校对:殷丽华老师 王乐老师 鲁辉老师