来源: 发布时间:2025-02-25
在人工智能(AI)的宏大叙事中,杨睿刚以他在计算机视觉领域的深厚造诣,成为一个“特别的存在”。他的独特之处不仅在于他回国加入百度、嬴彻之前早就已经是一位全球知名的计算机视觉研究科学家,对三维重建和3D数据分析领域有着诸多世界级的贡献,更在于他回国后为整个人工智能研究带来了新的视角和可能性。伴随着在百度最复杂自动驾驶开源数据集的开发和嬴彻在智能重卡自动驾驶商业运营里程上的突破等成果先后落定,他转身重回学术怀抱,只为打造心中那个“以人为本的人工智能”和“更懂自己的人工智能”。
——记上海交通大学溥渊未来技术学院教授杨睿刚
黄雪霜 张利霞
人工智能工业界有句老话:得视觉者得天下。
在智能世界中,机器以强大的数据搜集与分析能力给各行业带来颠覆性的改变,而实现这一切的关键是为机器点亮一双“智慧之眼”。可以说,计算机视觉就是人工智能的“眼睛”,是感知客观世界的核心技术。如今,这项技术已在自动驾驶、医疗机器人、智能供应链管理等各种人工智能的应用场景中发挥着至关重要的作用。
自2024年春末起,科技界便流传着杨睿刚从中国卡车智能驾驶独角兽——嬴彻科技CTO任上离职的传闻。近日,随着他的名字在上海交通大学的官网上亮相,这位三维计算机视觉和自动驾驶研究领域的“名将”重返学术界已尘埃落定。
“在嬴彻科技4年的历练,我兑现了将自动驾驶卡车从双驾简化为单驾的承诺,和同伴一起实现了技术的突破与商业化的初步探索。尽管工程化是任何公司成长的重要部分,但我个人更倾向于从事那些我最热爱,也最擅长的从0到1或者从1到10的创新探索工作。”选择更为审慎的步伐,杨睿刚将目光投向了广阔的交叉学科领域。在与上海交通大学的合作中,他看到了人类健康、情感与人工智能、计算机视觉交汇处的无限可能,这些领域的融合正是他所追求的创新沃土。
秉承对创新始终如一的追求,杨睿刚又一次开启职业生涯的新篇章。
从“求是园”走向国际科研殿堂
杨睿刚的父亲是浙江大学计算机系的教授,早在20世纪80年代就作为第二批国家公派的留学生前往美国深造并回国执教。基于这样的“便利”,杨睿刚很早就接触计算机并产生了浓厚的研究兴趣。
在浙江大学浓厚的文化氛围中,杨睿刚“肆意”地成长。“那会儿的孩子可没有如今这般繁杂的兴趣班。”幸运的是有浓厚的学习氛围相伴,身边皆是乐学重教的学者,对杨睿刚来说,“学习并不是一件难事儿,只要跟着老师按部就班,就可以拿到不错的成绩”。与书本和自然为伴,玩乐与学习并重,这种平衡,成为他日后坚持的信念——工作与生活的平衡,正如橡皮筋,需要张弛有度。
20世纪90年代初,计算机行业正处于蓬勃发展的时期,而杨睿刚的成长背景,注定了他要搏击在这股科技浪潮之中。在兴趣的牵引之下,他很自然地选择了子承父业。出于“想离家到外面的世界去看一看”的想法,凭借优异的成绩,他在1992年如愿考入清华大学计算机系,正式踏上了专业研究之路。在清华大学4年的本科学习时光中,他不仅体验到了与之前截然不同的学习节奏,更在知识的海洋中迅速吸收新知,展现出了对新事物的快速学习能力。即便“身边强手如林”,他也能始终保持一颗平和的心态,不急不躁,稳步前行。
因为深受父亲的影响,杨睿刚很早就笃定也要到外面的学术殿堂“闯一闯”。1996年本科毕业后,他带着对知识的渴望走出国门,没想到这一去,就是20余年。
1998年,杨睿刚在美国哥伦比亚大学获得硕士学位。在那里,他不仅适应了异国他乡的生活节律,更重要的是,迅速掌握了很多基本的知识和技能,磨砺了自己的研究技巧。这段经历为他日后的科研工作奠定了坚实的基础。
随后,杨睿刚转战北卡罗来纳大学教堂山分校,开始了真正深入的科研。在那里,他度过了学术旅程中最为漫长的博士生涯,师从著名的人机交互技术专家格雷格·韦尔奇(Greg Welch)教授。这是一段收获颇丰的旅程。在那里,他不仅吸收了丰富的专业知识,也在科研实践中锻炼了自己的能力,学会了如何在学术的海洋中与他人合作,以及如何在科研的道路上不断探索和创新。他感激在求学路上遇到的老师们,他们不仅传授知识,更塑造了他的学术精神和教育理念。他们给予杨睿刚的,远不止书本上的知识,还教会了他批判性思维的重要性,培养了他对复杂问题的分析能力。他们的教诲超越了课堂,触及了品格的塑造和人生的智慧,让他在未来的学术旅程中,能够以更加开阔的视野和更加成熟的心态,去引领和启发更多的学生。
毕业后,杨睿刚接受了美国肯塔基大学计算机系的教职,正式开启了他独立科研和教学的征程。凭借卓越的教学与研究能力,他逐步晋升为终身副教授,随后又被提升为正教授。他感慨自己的幸运,因为在这里,无论是学校还是整个州,都给予了他巨大的支持。肯塔基大学为他提供了广阔的发展空间,尤其在他职业生涯的早期,这种支持让他得以快速建立自己的团队,并迅速形成了一个正向的循环:明确的方向吸引优秀的学生,优秀的学生产出高质量的论文,高质量的论文又带来更多的研究机会。
用十余年的时间,杨睿刚从一名普通的教员起步,逐步成为领域里知名的教授。这份坚持和专注,让他收获了丰富的研究成果和学术声誉,也为他赢得了学生和同行的广泛尊重。其间,他坚持与世界顶尖学者展开交流与合作,如到苏黎世联邦理工学院担任了一年的客座教授,在那里,他与著名的欧洲科学院院士马克·波利菲斯(Marc Pollefeys)教授团队紧密合作,共同探索计算机视觉的前沿课题。这些交流与合作使他对计算机视觉的理解更加深刻,为他后来的科研注入了新的活力。
“幸运之神”眷顾下打开计算机视觉智能研究大门
从浙江大学求是园的青石板路,到走向国际科研殿堂的广阔舞台,杨睿刚早年的求索是一段不断积累和超越的历程。他反复强调自己很“lucky(幸运的)”,不管是早年沐浴在浓厚的学术环境下得以茁壮成长,还是踏入国际学术研究殿堂后一路有友善的恩师指引、比较多和比较大的项目支持等。在“幸运之神”的眷顾之下,他的求知欲和好奇心始终如一。这份对未知科技世界探索的渴望,成为他不断前行的内在动力。他一步步走到了计算机视觉研究的浪潮之尖,收获了一系列居于世界前列的科研成果。
到美国后,杨睿刚踏入计算机视觉与计算机图形学研究领域,主要研究三维重建和3D数据分析,并研发了世界上第一个基于GPU的高速立体匹配算法。他特别强调了恩师——亨利·富克斯(Henry Fuchs)教授对自己的影响。富克斯教授是美国艺术与科学院院士、计算机图形学领域的元老之一。他对GPU的研究贡献巨大,开创了可编程GPU,为深度学习和许多相关领域的发展做了铺垫。虽然德高望重,但富克斯教授的教育方式始终是建立在与学生平等对话的基础之上。杨睿刚记得自己在与恩师商议研究课题时,提出的想法常是被提出和使用过的,但导师始终以一种鼓励的方式回应他,告诉他每个想法都是站在巨人的肩膀上,每一次尝试都让他更接近创新的前沿。自由平等开放尊重带来鼓舞,杨睿刚在自己的博士生导师格雷格·韦尔奇教授身上也感受颇多。两位导师不仅传授了杨睿刚研究方法,更重要的是培养了他对研究的正确态度和心态。
此外,杨睿刚还很幸运地成为张氏标定算法的发明人、世界知名人工智能和机器人科学家——张正友——最早期的几个实习生之一。在张正友的引领下,杨睿刚得以深入探索3D视觉研究的广阔领域。他对科学前沿和关键技术的敏锐洞察,激发了杨睿刚在视觉和机器人系统领域的不懈追求。
刚步入独立科研的轨道时,杨睿刚就“很幸运”地申请到了一项专为年轻教授提供的5年资助计划项目,类似国内的杰出青年科学基金,这一项目很难申请,而他一举成功,不仅证明了自己的科研实力,更为他扬起了自信的风帆。在项目中,杨睿刚基于在北卡罗来纳大学教堂山分校时在可视化技术、远程三维重建等方面的积累,大胆地和团队成员构建了一个创新的场景:他们不仅满足于创造一个简单的二维“窗口”来进行交互,而是利用大量的摄像头和大屏幕显示技术,创建了一个能让世界各地的人们在一个虚拟的三维环境中进行交流和互动的平台,将三维世界的真实感带入虚拟空间,让远程的互动变得更加生动和直观。这其实是对元宇宙的初步探索。2005年,凭借相关成果,他荣获美国国家科学基金委员会颁发的杰出青年奖(CAREER奖)。
通过多年探索,杨睿刚在三维显示和三维重建两大方向上形成了自己具有代表性的成果。他在三维显示技术方面的成果如今看来仍具有指导意义。而在三维重建领域,无论是重建人的模型、脸的模型,还是在动态模型自然场景和数字孪生城市等方面,他的工作都为业界所熟知。譬如他和团队基于之前的算法积累研发的世界第一个实时稠密三维重建系统,获国际计算机视觉和模式识别领域的顶级会议(CVPR)最佳演示奖等。他还开创了基于语义理解的三维大规模重建方法,多次得到美国联邦政府的小企业创新奖(SBIR/STTR Awards)。
多年创新积累换来了累累硕果,杨睿刚研发的结合深度学习的立体匹配算法在KITTI基准库(自动驾驶和计算机视觉领域中被广泛使用的基准数据集)上排名第一。他在《计算机视觉国际期刊》(IJCV)、《IEEE模式分析与机器智能汇刊》(IEEE T-PAMI、SIGGRAPH),IEEE国际计算机视觉与模式识别会议(CVPR)和计算机视觉国际大会(ICCV)等计算机视觉和图形学领域顶级期刊和会议上发表论文130余篇,谷歌学术搜索引用超过万次。凭借在学术上的积累,他获得了业界的肯定,先后担任计算机视觉顶级期刊《IEEE模式分析与机器智能汇刊》编委,并多次担任顶级国际会议主席。
2012年左右,杨睿刚参与了美国国家科学基金会(NSF)支持的一个前沿项目,开始从纯粹的计算机视觉研究步入机器人研究领域。在项目中,他和团队开发了一套虚拟焊接机器人系统。这项工作不仅展示了杨睿刚追索科学前沿的前瞻性,也为他赢得了工业界的广泛关注。通过这项工作,他意识到机器人技术研究任重而道远,促使他进一步扩展自己的研究方向,并在此过程中培养了一批优秀的科研人才。随后,他和团队还在多机器人协同方面进行了深入探索,并进行了一些有益的应用尝试。这些经历让杨睿刚深刻认识到,科研工作不仅要发表高质量的论文,更要注重其在实际应用中的价值。而这,也是促使他回国进一步扩展研究,并开始广泛接触产业界,“以终为始”做科研的开端。
回国“从0到10”构建更懂你的人工智能
2017年是杨睿刚人生中一个重要的转折年,这一年,他正式踏上了归国的航程。
彼时,作为人工智能一个重要分支的深度学习受到越来越多的关注,国内外无论是工业界还是学术界都投身到深度学习的洪流之中。百度、阿里巴巴等大公司纷纷对外公开宣布了人工智能的战略计划,一股海归的潮流开始涌动。杨睿刚怀着探索的心态与国内的同行交流。幸运的是,他获得了百度的邀请,加入这个正在人工智能领域大步迈进的科技巨头,任百度研究院机器人和自动驾驶实验室主任。
在百度,杨睿刚体验到了前所未有的信任与支持,特别是百度CTO王海峰老师给予了他和团队充分的自由探索空间。百度对技术的尊重、敏感性,以及对创新的无限追求让他愿意在这个敢于创新的群体里竭诚贡献自己的智慧。
在百度的3年时间里,杨睿刚主持开发了世界上标注量最大的自动驾驶开源数据集ApolloScape,领导科研小组开发了感知、决策、控制的全栈系统在半封闭场景下的工程机械智能化孵化项目和原型产品。“让研究成果真正应用到现实中”,因为心怀这个梦想,昔日在实验室里埋首耕耘的他开启了前所未有的体验。为“让挖掘机实现自动驾驶”,昔日在实验室里埋首耕耘的他领着一群留洋归来的科研人员深入尘土飞扬的施工地与包工头组成了“突破次元壁的组合”,而这些前所未有的“奇妙”体验让他对应用研究有了“更接地气”的感观和启发。
2020年,杨睿刚告别百度正式加入嬴彻,全面负责嬴彻中美两地的自动驾驶技术研发。对他来说,这又是人生中一次非常重要的体验,因为是他真正深入产业的工作。“中国有众多研究自动驾驶的企业,但嬴彻是卡车智能驾驶的‘独角兽’,”杨睿刚坦言当赢彻向他展示公司的设计时,那个独到和务实的商业模式深深吸引了他,“截至2020年,中国约有2000万重卡司机,他们承担着全国74%的货运量和31%的周转量。在长途驾驶中,司机需持续操作,这对体力和精力都是巨大的挑战。嬴彻科技致力于通过激光雷达、毫米波雷达、高清摄像头和自动驾驶计算平台等技术,减轻司机负担,提升驾驶舒适性。”到嬴彻后,杨睿刚的贡献尤为显著,他不仅推动了自动驾驶技术在货运领域的应用,更是带领赢彻在重卡智能驾驶的赛道上,以0到10的创新精神,实现了技术革新和运营里程的突破。在他和企业团队的共同努力下,嬴彻科技实现了运营端100%的单驾模式覆盖,达到了人力成本与管理成本的双重降低等。
凭借在三维计算机视觉及自动驾驶领域的突出贡献,杨睿刚在2022年度当选国际电气与电子工程师协会会士(IEEE Fellow)。同年当选的,不乏大众熟悉的百度首席技术官王海峰、清华大学信息科学技术学院副院长汪玉、阿里巴巴集团副总裁李飞飞等人工智能的“大牛”。
在上海交通大学溥渊未来技术学院,杨睿刚即将翻开崭新的篇章。他深刻认同学院的院训:溥博渊泉,与日俱进。这一理念不仅展现了学院对精神广博深邃和文化开放包容的追求,也与他个人的理想不谋而合。未来技术学院院长倪军教授、执行院长金隼教授及党委书记杨明教授和葛天舒教授等领导对他的信任和支持,让他备感鼓舞。在学院里,他感受最深刻的是那股实事求是、脚踏实地的工作氛围。怀揣无尽好奇心的杨睿刚,对于即将展开的工作和未来科技蓝图充满了无比的兴奋和憧憬,对未来的无限可能满怀期待。在未来科技蓝图中,他勾勒出了一个“以人为本的人工智能”的宏愿。这个人工智能体在内——不仅拥有卓越的智商,更具备深刻的情商,它能够通过分析行为、表情和生理信号来理解人的情感和健康状态,也将超越被动观察,实现主动探索和学习,打造一个“更懂你的人工智能体”;而在外——它能通过人工智能技术推动主动健康等领域的革新,从而大幅提升人类的生活质量,“带来更加幸福、健康、高效和愉悦的生活体验”。