具身智能机器人(Embodied Intelligent Robots)是人工智能的终极形态之一,它不仅具备强大的感知和认知能力,还能通过自身的身体(Body)在物理世界中执行任务。我们的研究将前沿的决策理论、控制理论与多智能体系统相结合,目标是赋予移动机器人和机械臂在复杂、动态环境中自主感知、智能决策和高效协同作业的能力:
1)复杂环境下的智能运动规划与决策理论: 探索基于深度强化学习(DRL)的非结构化环境路径规划;研究时空约束下(如高速产线、动态避障)高鲁棒性的实时行为决策。
2)基于大模型的机器人高级控制与规划: 探索基于 LLM (大语言模型) 和 VLM (视觉语言模型) 驱动的机器人控制。研究如何利用这些模型将复杂的人类自然语言指令分解为机器人的具体动作序列,实现高级别的任务规划和动作推理。
3)融合导航与高精度定位: 结合多源传感器(视觉、激光雷达等),研究多机器人系统的多模态融合导航;实现高精度、无漂移的自主定位与建图。

图 1 基于VLM (视觉语言模型) 驱动的无人车智能导航与规划
在智能制造和工业4.0时代,产品质量是企业的生命线。传统的依靠人工检测费时费力、效率低下且易受主观因素影响。工业视觉检测技术,正是解决这一痛点的核心技术,它赋予了机器“看”和“理解”的能力,成为智能制造产线不可或缺的“慧眼”。我们致力于突破传统视觉检测的局限,利用先进AI技术实现对复杂工业缺陷的高精度、高效率智能感知与分析:
1)复杂环境下的缺陷智能感知: 研究多模态数据(可见光、红外、3D点云等)的融合感知技术;提升对微小、隐蔽、多变缺陷的鲁棒识别能力。
2)小样本/弱监督缺陷检测算法: 聚焦小样本学习(Few-Shot Learning)、自监督学习等方法;解决工业界缺陷样本稀少、数据标注成本高昂的问题。
3)高精度识别分析及算法部署: 研发高性能的缺陷分割与分类网络;研究模型轻量化和硬件-软件协同优化,实现边缘侧的实时、高效部署。

图 2 基于视觉模型驱动的工业产品缺陷智能检测
工业大模型(Industrial Large Models)是AI技术在工业领域实现跨越式发展的关键,它旨在整合海量的工业数据、机理模型和专家知识,构建一个具备领域知识、推理能力和决策能力的智能中枢。本方向通过将数据驱动与知识融合相结合,开发用于复杂工业过程(如注塑成型)的优化、控制与预测的工业大模型。:
1)基于大模型的故障诊断与预测性维护: 利用工业大模型的强大的语义理解和推理能力,整合时序数据、设备日志、专家报告等异构数据,实现高精度、可解释的故障诊断、根因分析和全生命周期预测性维护。
2)工业智能体的构建与群智协同: 研究如何基于大型基础模型(LLM/VLM)打造能够自主感知、规划、决策和执行的工业智能体(Industrial Agents)。探索多智能体系统(MAS)在复杂任务中的群智协同和资源优化分配。
3)基于大模型的优化与控制方法: 基于大模型的实时预测与推理能力,应用于关键工艺参数的智能优化决策和自适应控制(如注塑成型过程的质量控制)

图 3 基于大语言模型驱动的制造工艺过程故障诊断与预测性维护
本方向探索AI理论的底层创新,为上述三大应用方向提供更具科学性、泛化性和可解释性的底层工具:
1)AI for Science (AI4S): 研究AI在科学发现、机理建模、仿真计算等领域的应用,加速科学研究和工程创新。
2)数据驱动与知识融合建模: 探索因果推断、知识图谱等技术,增强模型的可解释性和在小数据场景下的泛化性。
3)物理信息神经网络(PINN): 研发和应用PINN,解决偏微分方程、复杂流体动力学等受物理定律约束的工业问题,提高模型精度和可靠性。
研究愿景:面向复杂动态环境下的智能制造、仓储物流及无人作业等场景,致力于解决自动导引车(AGV)、
无人车(UGV)及具身智能机器人在实时最优控制、自主导航策略优化、语义理解及多智能体协同等方面的关键挑战。
🎯 核心内容: 未知大尺度环境下的开放词汇目标感知与自然语言指令导航。
🛠️ 研究方法: 采用异步双流控制架构,结合基于DBSCAN深度聚类的轻量化主动视觉-语义记忆网络。
💡 创新突破: 将低频的LLM/VLM语义推理计算与高频的底层运动控制在时间戳层面上实现解耦,彻底消除了机器人的“走停”现象;通过构建稀疏语义拓扑地图,实现了高抗噪的三维空间定位与零样本目标匹配。

🎯 核心内容: 复杂动态多障碍环境下的移动机器人轨迹规划与自主导航。
🛠️ 研究方法: 提出基于行为克隆(BC)引导的策略优化方法(BCPO),以及基于李雅普诺夫函数的隐式策略RL框架。
💡 创新突破: 创新性地将行为克隆策略显式定义为动作可行域,约束RL探索;结合混合优先经验回放与稳定性先验,完美兼顾训练稳定性与系统安全自主探索能力。
🎯 核心内容: 工业AGV在包含动态障碍物场景下的高效最优导航。
🛠️ 研究方法: 采用软演员-评论家(SAC)与双延迟深度确定性策略梯度(TD3)等算法,引入时间衰减型目标达成奖励、指数型安全惩罚等多维度复合辅助奖励。
💡 创新突破: 提出自适应探索噪声衰减与动态延迟更新机制,将隐式导航目标转化为显式优化动力,显著加快收敛并提升模型在未知动态场景下的泛化能力。


🎯 核心内容: 具有非完整运动学约束与物理障碍物限制的无人车/船最短时间(ZNP)轨迹规划。
🛠️ 研究方法: 离线利用高斯伪谱法(GPM)求解海量最优轨迹并构建状态-控制对数据集,在线使用深度神经网络(DNN)进行端到端实时控制。
💡 创新突破: 将复杂的动态同伦约束和碰撞避免约束转化为平滑的惩罚函数,实现了极具挑战的水面流场干扰及动态障碍物场景下USV的实时高保真最优控制拟合。
🎯 核心内容: 适应仓储场景微调的轻量化AGV轨迹重规划技术。
🛠️ 研究方法: 采用宽度学习(BL)网络替代深层网络结构,并结合谱范数(Spectral Norm)正则化增强Lipschitz连续性。
💡 创新突破: 宽度网络极大地降低了模型训练与推理的算力消耗,赋予了底层控制器在面临突发环境变化时的在线增量式快速学习和实时重规划能力。

🎯 核心内容: 人机混行复杂环境下的移动机器人安全且符合社会礼仪的拓扑运动规划。
🛠️ 研究方法: 结合动态同伦类(Homotopy Classes)优化与模型预测控制框架。
💡 创新突破: 克服了传统T-MPC缺乏社会规范感知及对多模态不确定性障碍物预测不足的局限,实现了风险感知的全局同伦最优安全穿行。
🎯 核心内容: 基于Motion Primitives的机器人安全轨迹生成,以及多智能体系统的有限时间一致性协同。
🛠️ 研究方法: 基于高斯混合模型(GMM)进行示教轨迹的概率密度表征,及随机微分方程驱动分析。
💡 创新突破: 在多智能体系统中创新性地将随机噪声转化为稳定控制力,实现有限时间内的快速一致性;从专家示教中提取具备Lyapunov稳定性的运动原语,在障碍环境下实现安全运动复现。


1. Haisen Guo, Zhigang Ren*, Jialun Lai, Zongze Wu, Shengli Xie. Optimal navigation for AGVs: A soft actor–critic-based reinforcement learning approach with composite auxiliary rewards. Engineering Applications of Artificial Intelligence, 2023.
2. Jialun Lai, Zongze Wu, Zhigang Ren*, Qi Tan, Shengli Xie. Trajectory planning of mobile robot: A Lyapunov-based reinforcement learning approach with implicit policy. Knowledge-Based Systems, 2025.
3. Jialun Lai, Zhigang Ren*, Zongze Wu, Qi Tan, Shengli Xie. Learning-based real-time optimal control of unmanned surface vessels in dynamic environment with obstacles. Ocean Engineering, 2025.
4. Zijianglong Huang, Zhigang Ren*, Tehuan Chen, Shengze Cai, Chao Xu. Autonomous Navigation and Collision Avoidance for AGV in Dynamic Environments: An Enhanced Deep Reinforcement Learning Approach With Composite Rewards and Dynamic Update Mechanisms. IET Cyber-Systems and Robotics, 2025.
5. Jialun Lai, Qi Tan, Hanzhen Xiao, Zongze Wu, Zhigang Ren*. Optimal Navigation of an AGV with Obstacle Constraints: A Broad Learning-Based Approach. IEEE Transactions on Emerging Topics in Computational Intelligence, 2025.
6. Jialun Lai; Zongze Wu; Zhigang Ren*; Ci Chen; Qi Tan; Shengli Xie; A Lyapunov-Based Framework for Trajectory Planning of Wheeled Vehicle Using Imitation Learning, IEEE Transactions on Automation Science and Engineering, 2025, 22: 12118-12133
1. 注塑工艺智能制造领域:
项目团队在注塑工艺智能制造领域取得了系统性的创新成果,核心聚焦于解决传统制造中实时控制不足、经验依赖严重以及知识管理低效等关键科学问题。研究成果主要体现在三大方面:先进的数据驱动操作优化理论、高鲁棒性品质快速预测方法以及知识自动化技术体系。
1)在操作优化与控制理论方面,提出了基于注塑过程模型与数据驱动的深度神经网络实时最优控制学习算法,用于注塑机内部熔融物流动前沿的实时跟踪控制。该算法克服了现有技术中优化耗时久、重复调参和环境自适应性不足的弊端,实现了根据注塑机当前系统状态快速响应出下一步最优输入控制信号。该理论的核心特色在于其具备高度的实时性、收敛稳定性及鲁棒性,显著节省了优化时间。此外,针对传统工艺参数优化依赖经验“试错”的痛点,创新性地提出了基于强化学习的注塑制造过程工艺参数智能自动调优方法。该方法通过状态、动作和奖赏学习最佳决策,具有自适应学习能力,能够快速找到最佳的工艺参数组合,从而有效提高产品质量和生产效率。

图 1-1 基于强化学习的注塑过程工艺参数智能自动调优方法
2)在数据驱动的品质预测与分析方面,解决了注塑产品质量预测中存在的数据不平衡、小样本及异常值检测困难等难题。提出了基于数据驱动的P范数双增强层宽度学习(pNBEBLS)注塑品质快速预测算法,提升了算法模型应对异常数据和少量样本数据的能力,突出的技术特色是其结构简单、响应速度快、泛化性能好,适用于快速尺寸预测。同时,通过应用多种机器学习方法(如决策树、KNN、SVM等),实现了注塑工艺品质的自动特征提取和深入分析,避免了人工处理的效率瓶颈,降低了长期的人力成本。


3)注塑知识自动化与智能管理:构建了完整的注塑工艺缺陷知识获取及知识图谱方法,形成了从知识标注到图谱构建的完整技术链。该技术实现了注塑工艺领域知识的自动化抽取、结构化表达与高效应用,解决了海量缺陷知识离散、关联性差,导致故障定位困难的问题。基于此,研发了面向注塑工艺知识缺陷的可视化知识图谱管理平台及系统,具备知识抽取、缺陷级联搜索(支持复杂问题溯源)和故障诊断功能。更进一步,基于大语言模型(LLM)进行深度微调,注入注塑专业知识,构建了一个“永不离线的注塑工艺AI专家”智能管理系统。该系统通过“模型微调、知识提取、智能检索、应用集成”的“四步走”策略,能够通过一问一答的自然语言交互,精确诊断缺陷原因并提供优化建议,将隐性经验显性化,将碎片知识系统化,打造了一个“超级大脑”。


图 1-4 基于知识自动化的注塑工艺知识获取及知识图谱构建

图 1-5 基于大语言模型驱动的注塑工艺知识智能管理系统
图 1-6 注塑工艺参数优化与推荐软件系统