来源: 发布时间:2025-08-07
——记香港城市大学机械工程系助理教授殷鹏
杨 洁 文卓君
2025年《政府工作报告》提出,培育生物制造、量子科技、具身智能、6G等未来产业。作为具身智能重要方向的人形机器人,在工业制造、生活服务等领域已展现出巨大潜力。在竞争如火如荼的时刻,如何让机器人操作更精细、“走位”更精准,成了制胜关键。多年来,香港城市大学机械工程系助理教授殷鹏专注于现场机器人定位、建图、导航和决策制定等方面的研究。在具身智能浪潮席卷全球的当下,他和团队正在挑战机器人操作层的精度极限,其研发成果已得到广泛应用。而他求学和科研的经历,恰好见证并参与了我国机器人认知领域的跃迁过程。
机械启蒙:在虚构与现实间寻找支点
从小学起,殷鹏就对机器人兴趣浓厚,尤其是在展会上第一次目睹了双足机器人完成行走动作时感受到的震撼,更让他笃定对机器人的爱好不是一时性起。
从此,少年殷鹏的活动轨迹开始固定为“家—学校—图书馆”的三点一线。“当时同学们都在备战竞赛,我却沉迷于编写简易机械臂的伦理约束程序。”殷鹏回忆道。但恰恰是这颗深埋的种子,不断萌发,让他想更深入了解机器人、研究机器人,也催他奋进。2009年,殷鹏以优异的成绩叩开了被誉为“中国机器人摇篮”的哈尔滨工业大学(以下简称“哈工大”)的大门。
在哈工大机电工程学院的4年大学生涯中,殷鹏经历了第一次认知跃迁。在这里,他接触了很多机器人的项目,受启发于学校及项目,这个行业让他越发着迷。系统思维框架的搭建,就像突然打开了多棱镜,更是让他意识到跨学科的重要性,比如——机械的物理运动需要生物学认知的加持。
2013年本科毕业后,殷鹏选择进入中国科学院沈阳自动化研究所。中国机器人的许多“第一”,都诞生在这里。在沈阳自动化研究所期间,殷鹏参与了基地项目和无人船项目,经受住了从无到有科研实践的挑战,更在实践维度不断积累经验。而此时,他也意识到,想让机器人“活”起来,他的知识结构还存在缺口。
“当面对复杂环境下的智能决策需求时,传统自动化理论显得不够用了。”殷鹏说,基于这种考虑,他在完成硕士研究生课程后,跨专业攻读机械电子工程博士学位,将研究方向转向人工智能与强化学习。
“当时,对于我的选择,很多人不理解。但我始终觉得,只有突破学科壁垒,才能解决通用机器人的核心问题。”就这样,这种高强度的学习和实践持续了整整两年。2017年,他关于多模态感知融合的研究成果登上学界顶尖讲台,这也标志着他的学术路径实现了又一次蜕变。
系统革命:构建机器认知的“元能力”
“在科技快速发展中展现出敢于挑战和跨学科思维的优势,这可能是未来科学革命的催化剂。”基于对智能理解的不足与对知识的渴求,殷鹏决定去美国深入体验最前沿的竞争和技术发展。
2019年年初,殷鹏在美国卡耐基·梅隆大学(CMU)机器人研究所做博士后研究员。事实上,早在2017年,殷鹏就曾以访问学者的身份来到这座诞生过12位图灵奖得主的学术圣地。自此,一条驶向星际的征途拉开了帷幕。
因为缺少真实世界的测试场景,在2019年,通用机器人研究就像在沙漠找绿洲。即便在CMU,涉足相关领域的研究组也算比较前沿的。殷鹏脚下的路可谓崎岖难行。
转机出现在2019年年底,殷鹏加入自主感知与机器人交互实验室(AirLab)课题组后,与这一领域泰斗级学者进行深度合作,让他找到了理论突破的着力点。从开发多机器人地图拼接技术以应对地下挑战,到突破定位难题以建立超大规模多机协作系统,殷鹏在机器人和导航深度融合的这条跨界之路上,越走越深。
从2019年到2021年,在担任美国防高级研究计划局地下挑战赛(DARPA SubT)的技术负责人期间,殷鹏和团队为地下环境开发了第一个大规模(超过100千米)多代理众包地图系统AutoMerge。最后,随着殷鹏和团队研发的第一代奥特曼兔和第二代奥特曼兔的诞生,项目中的问题得到了完美解决,也为后续在未知领域探索建模提供了高效的解决方案。
在此期间,殷鹏和团队还开发了首个超大规模多机协作定位建模系统。系统旨在解决在无GPS环境下的定位问题。“这是一种新的定位方法,通过研究火星和月球表面的定位技术,使得机器人能够在不稳定的地磁环境中精确着陆。以火星着陆项目为例,实现了在3000米到10米的着陆过程中,飞船可以达到20米的定位精度。”殷鹏介绍,他们还在后续的研究工作中对地图拼接技术和多机协作定位技术做了进一步提升。如今,这些技术在无人驾驶、服务性机器人联合导航定位等方面得到了很好的应用示范。
基于这项工作,2023年,殷鹏发表了他的第一篇《IEEE机器人与自动化汇刊》(IEEE T-RO)文章,研究设计了一套定位方法,叫“iSimLoc”。最终,这项成果不仅被国家航空航天局(NASA)采纳为火星着陆参考方案之一,更重要的是构建了通用人工智能的基础能力——大规模复杂环境中的时空认知。
如果说iSimLoc项目是技术突破,那么与英伟达合作的终身定位学习系统则是范式革新。2021年年底,殷鹏与英伟达合作了这一项目。“项目基于脑神经学机制,利用海马回和大脑皮层之间的数据交换来优化机器人行为。”殷鹏介绍,他和团队通过仿生学的大脑记忆能力对机器人行为进行优化,使机器人能持续学习和进化,无需频繁人工干预。随着研究的不断深入,殷鹏也收获了累累硕果,尤其是他基于这些研究发表的3篇重磅论文,引发了行业内外的关注。
从浪漫的冰城起步到探索浩瀚的星辰,从自动化控制到认知科学,殷鹏用十余年完成了一场持续的知识越境。
创新攻坚:重构机器人进化逻辑
2023年,殷鹏迎来了职业生涯的新篇章,入职香港城市大学担任机械工程系助理教授。在新的事业起点上,他和团队开发了一个通用数据引擎平台,用于大规模操作数据收集,以为机器人操作提供基础模型。“我目前的工作重点是利用关键技术,在终身学习和具身化趋势中实现通用机器人长期和大规模定位、导航及感知。”殷鹏介绍。
谈及选择香港的缘由,殷鹏直言这座中西交融的国际都市为其科研与产业融合提供了独特土壤。在他看来,香港的独特优势在于“左手学界,右手业界”的融合生态。“这里既有国际化的科研网络,又背靠大湾区制造业腹地,更有全球顶尖人才的自由流动。”他举例称,入职仅3个月,团队就与香港科技园、深圳头部机器人企业建立了联合实验室,并接入欧洲某顶尖仿生机械臂厂商的硬件开发平台。“这种跨界协同效率,在单一文化环境中难以实现。”
这种双向赋能,在殷鹏主导的“具身智能操作系统”项目中尤为凸显——通过联合20余家产业链上下游机构,团队正构建全球首个支持多模态融合的机器人开发框架,目标将新产品研发周期缩短60%。
面对全球机器人产业的“阿喀琉斯之踵”,殷鹏的攻关方向直指操作层核心技术。在其实验室中,搭载仿生神经网络的灵巧手能完成穿针引线级精密操作,而基于因果推理的行为泛化模型,则让机器人面对未知物体时展现类人学习能力。“当前全球90%的研究集中于视觉与语言大模型,但让机器真正‘动手’,才是颠覆性变革的临界点。”他透露,团队最新成果已实现餐具整理、电子元件装配等复杂任务的零样本迁移,相关论文入选机器人顶会机器人科学与系统大会(RSS)2024最佳系统论文。
对于导航技术的演进,殷鹏提出“时空记忆体”概念。传统激光同步定位与建图(SLAM)技术虽成熟,却困于静态环境假设。“真正的智能导航应像人类逛超市——记得牛奶区在第三排,知道推车会改变货架空间,甚至预判高峰期人流走向。”其团队首创的EgoMem算法,通过大语言模型解析环境语义,结合行为链预测技术,使机器人在动态场景中的路径规划效率提升4倍。这项突破正在香港某三甲医院的配送机器人集群中验证,未来有望重塑仓储、零售等行业的自动化逻辑。