科学研究

当前位置: 中文主页 >> 科学研究

研究方向及领域

[研究方向概述]

🤖 具身智能机器人 (Embodied Intelligent Robots)：构建自主决策与协同作业的未来工厂

具身智能机器人（Embodied Intelligent Robots）是人工智能的终极形态之一，它不仅具备强大的感知和认知能力，还能通过自身的身体（Body）在物理世界中执行任务。我们的研究将前沿的决策理论、控制理论与多智能体系统相结合，目标是赋予移动机器人和机械臂在复杂、动态环境中自主感知、智能决策和高效协同作业的能力：

1）复杂环境下的智能运动规划与决策理论： 探索基于深度强化学习（DRL）的非结构化环境路径规划；研究时空约束下（如高速产线、动态避障）高鲁棒性的实时行为决策。

2）基于大模型的机器人高级控制与规划： 探索基于 LLM (大语言模型) 和 VLM (视觉语言模型) 驱动的机器人控制。研究如何利用这些模型将复杂的人类自然语言指令分解为机器人的具体动作序列，实现高级别的任务规划和动作推理。

3）融合导航与高精度定位： 结合多源传感器（视觉、激光雷达等），研究多机器人系统的多模态融合导航；实现高精度、无漂移的自主定位与建图。

图 1 基于VLM (视觉语言模型) 驱动的无人车智能导航与规划

👁️ 工业视觉检测 (Industrial Visual Inspection)：智能制造的“慧眼”

在智能制造和工业4.0时代，产品质量是企业的生命线。传统的依靠人工检测费时费力、效率低下且易受主观因素影响。工业视觉检测技术，正是解决这一痛点的核心技术，它赋予了机器“看”和“理解”的能力，成为智能制造产线不可或缺的“慧眼”。我们致力于突破传统视觉检测的局限，利用先进AI技术实现对复杂工业缺陷的高精度、高效率智能感知与分析：

1）复杂环境下的缺陷智能感知： 研究多模态数据（可见光、红外、3D点云等）的融合感知技术；提升对微小、隐蔽、多变缺陷的鲁棒识别能力。

2）小样本/弱监督缺陷检测算法： 聚焦小样本学习（Few-Shot Learning）、自监督学习等方法；解决工业界缺陷样本稀少、数据标注成本高昂的问题。

3）高精度识别分析及算法部署： 研发高性能的缺陷分割与分类网络；研究模型轻量化和硬件-软件协同优化，实现边缘侧的实时、高效部署。

视觉检测.gif

图 2 基于视觉模型驱动的工业产品缺陷智能检测

🧠 工业大模型垂域应用 (Vertical Application of Industrial Large Models)

工业大模型（Industrial Large Models）是AI技术在工业领域实现跨越式发展的关键，它旨在整合海量的工业数据、机理模型和专家知识，构建一个具备领域知识、推理能力和决策能力的智能中枢。本方向通过将数据驱动与知识融合相结合，开发用于复杂工业过程（如注塑成型）的优化、控制与预测的工业大模型。：

1）基于大模型的故障诊断与预测性维护： 利用工业大模型的强大的语义理解和推理能力，整合时序数据、设备日志、专家报告等异构数据，实现高精度、可解释的故障诊断、根因分析和全生命周期预测性维护。

2）工业智能体的构建与群智协同： 研究如何基于大型基础模型（LLM/VLM）打造能够自主感知、规划、决策和执行的工业智能体（Industrial Agents）。探索多智能体系统（MAS）在复杂任务中的群智协同和资源优化分配。

3）基于大模型的优化与控制方法： 基于大模型的实时预测与推理能力，应用于关键工艺参数的智能优化决策和自适应控制（如注塑成型过程的质量控制）

LLM故障诊断系统.png

图 3 基于大语言模型驱动的制造工艺过程故障诊断与预测性维护

🔬 前沿跨学科方法 (Interdisciplinary Methodology)

本方向探索AI理论的底层创新，为上述三大应用方向提供更具科学性、泛化性和可解释性的底层工具：

1）AI for Science (AI4S)： 研究AI在科学发现、机理建模、仿真计算等领域的应用，加速科学研究和工程创新。

2）数据驱动与知识融合建模： 探索因果推断、知识图谱等技术，增强模型的可解释性和在小数据场景下的泛化性。

3）物理信息神经网络（PINN）： 研发和应用PINN，解决偏微分方程、复杂流体动力学等受物理定律约束的工业问题，提高模型精度和可靠性。

个人信息

任志刚Zhigang Ren