欢迎您登录科学中国人官方网站!!
新浪微博|网站地图|联系我们
突破全息直觉理论 打造机器智能引擎

来源:  发布时间:2020-07-21

 

  智能机器人的发展正如同人类的文明和进化史一般,不断向着更高级的形态发展。一个充满挑战的问题正摆在人类面前,未来的智能机器人是否会拥有像人一样的智慧大脑和复杂意识?
  “当前以深度学习为代表的人工智能技术所能解决的问题往往需要具有大量可以借鉴学习的训练集,同时要求所获取的信息是完备的,而在复杂的真实应用环境中,采集到的数据往往包含大量噪声与不确定性,且仅包含环境的局部信息,导致了基于深度学习的人工智能应用的局限性。而在同样环境下,人类却往往可以依靠直觉做出较为迅速且适宜的判断,这为我们发展新的人工智能理论来解决上述问题提供了灵感。”在复旦大学,智能机器人研究院常务副院长、智能机器人教育部工程研究中心副主任张立华正带领一个科学家团队,与清华大学脑与认知科学研究院合作,提出了机器直觉这一新的交叉学科研究方向,致力于让机器实现类似甚至超过人类的直觉能力,赋予机器洞察力与创造性。
  在融合了人类智能+人工智能+群体智能的全息群智理论与机器直觉理论研究的基础上,他们力图打造赋智于机器人的核心智能引擎,为智能机器人的发展提供较为系统、完整的基础理论与关键技术支撑。
  作为曾经创业并在产业界卓有成就,如今回归科研一线,向前沿进发的优秀学者,张立华用20年时间,一手搭建起从科研创新到产业落地的路径,窥见了人工智能未来发展的壮丽图景。
  
从创新到产业化
  1994年,凯文·凯利写下了后来被誉为成功预言了人类未来的《失控:机器、社会与经济的新生物学》一书。在书中,关于智能机器人、大众智慧、云计算、物联网、虚拟现实、共生、共同进化等词汇第一次走进人类视野。如今,人工智能的时代已经来临,机器的深度学习已不再让人类感到陌生,也成为了人工智能系统向前发展的重要能力。
  同样是1994年,从清华大学自动化系自动控制专业本科毕业的张立华不会想到,在未来的20多年时间里,自己将参与一个又一个推动人工智能相关领域发展的重大项目开发和理论研究。
  选择自动化专业对于张立华来说颇有“无心插柳”的味道。他在清华大学1989年招生简章上看到自动化专业那一页中,有几张机器人的图片,引起了他的好奇,于是便选择了自动化系自动控制专业,从此与人工智能结下了不解之缘。
  2000年,张立华拿到了清华大学控制理论与控制工程专业博士学位,并获得了“清华大学优秀博士学位论文”奖,此后便开始了在国外的漫长研究生涯。
  博士毕业后的张立华在美国辗转从事科研工作多年,曾先后在多家芯片企业工作,并在全球视觉计算与人工智能行业领袖企业——美国英伟达公司等担任高级技术与管理职务。
  在美国多年,不仅让张立华完成了在人工智能科研领域的不断累积与进步,也对他未来的科研工作产生了巨大影响。在他看来,在保持科技创新的激情和动力的同时,同样要致力于实现创新技术的产业化。
  张立华供职过的其中一家企业,核心产品是三维物理仿真处理器芯片,该公司研发的物理仿真引擎也是当时世界上最好的两个物理仿真引擎之一。
  物理仿真引擎需要对刚体、流体、软体等进行模拟,相关算法非常复杂,需要很大的算力。张立华加入之后,参与研发以异构众核架构计算技术为核心的三维物理仿真引擎处理器芯片,这需要掌握刚刚初现端倪的异构并行计算技术,这意味着他需要重新进行大量学习和创新。
  那段研究经历,让他至今印象深刻。彼时,在三维游戏或工程设计中,物理仿真的技术应用很广。比如,一个游戏中的女孩子穿着裙子跳舞时的动态效果如何才能做得更逼真,就是张立华和同事需要攻克的难题之一。围绕一个个难题一一攻克,张立华和同事进行了物理仿真算法上的极致探索。
  技术的攻关没有止境,更大的问题在于如何实现芯片的产业化。即使算法做出来了,但若过于复杂,在当时的成本下,同样无法实现产业化。
  “我们还要进行优化,如果优化不了,就要对算法重新分析、重新设计。”张立华说,芯片做出来后,他们还要进行一一调试,让各方面的性能达到最佳。为了实现这款芯片的产业化,他们专门设计了一款针对异构架构处理器的性能分析软件,这个分析软件最终成为一款全球最早的异构系统性能分析的通用软件之一。
  而作为当时的主要参与者,张立华从首席工程师、研发经理,一步步升任为公司的技术总监,负责管理公司60%以上的研发工程师。后来,在英伟达公司工作后,正是由他带领团队,将三维物理仿真引擎从原来的处理器移植到英伟达的通用GPU(图形处理器)上。
  “我当时意识到,异构技术肯定是能够影响未来的新技术。”张立华说,曾经世界排名第一的中国“天河一号”超级计算机,用的就是异构计算技术。现在我们知道,正是以GPU为代表的异构并行计算技术的发展,才促进了今天深度学习的爆发式发展和应用。
  异构计算技术上的突破和三维物理仿真引擎芯片的产业化经历,让张立华体验到将一个新的科技创新实现成果转化,最终实现产业化,才是科研人最终的归宿。
  “后来,当我有了新的技术或新的想法,我就会想如何将它产业化,变成一个生产生活中真正可以创造价值的东西。如果只是在学校纯粹做理论研究,就无法产生这样的激情。”张立华说,只有真正了解社会的需求和产业的需求,并实现科研的成果转化甚至是产业化,才是真正“将论文写在大地上”。
  也正是因为这份产业梦想,张立华回国之初创立了长春博立电子科技有限公司,成立了国内最早、规模最大的异构并行计算技术开发团队,并于2015年入选国务院侨务办公室“重点华侨华人创业团队”。异构计算、人工智能与计算机视觉技术是张立华的强项,也是企业技术研发的主攻方向。以人工智能核心算法和异构计算技术为基础,博立电子进军智能汽车、智能机器人、智能制造、智能医疗以及智慧城市五大行业领域,让张立华多年的产业梦想得以开花结果,让他在学术研究上的积累有了落地的土壤。
  
颠覆性的理论探索
  在创业过程中,张立华深感产业发展离不开技术创新,而前沿技术创新迫切需要理论上的进一步突破,2017年9月,他回归科研一线,加入复旦大学,担任复旦大学智能机器人研究院副院长、机器人智能硬件与操作系统研发平台负责人、智能感知与无人系统实验室主任,负责推进人工智能与机器人科研平台建设,并参与策划上海市市级重大科技专项等。
  张立华认为,近年来以深度学习为代表的人工智能的发展方兴未艾,尤其是在图像分类、语音识别等特定领域研究,取得了很大的突破,但这些突破仍不具备通用性。现有的深度神经网络技术仅是对生物神经系统的初级模拟,功能大多局限于感知与理解层面,还难以在复杂时变、不确定性高的真实环境中应用。而未来的泛在智能机器人能够适应各种复杂的环境,自主地去完成各类复杂任务。
  目前业界普遍有一种观点认为,深度学习的发展已处于瓶颈期,人工智能想要进一步取得突破,就需要从新的方向和领域中去入手。三元空间群体智能理论,就是复旦大学以甘中学、张立华等为代表的人工智能团队认准的可以实现颠覆式变革的机器智能发展理论。在他们看来,未来世界不仅包含人类社会空间,也有基于互联网络形成的虚拟信息空间,此外还有物理空间。物理空间中就包含了未来的智能机器人与各类机智智能终端,面对这一三元空间,应如何根据新人类社会发展的新特点去发展人工智能的理论,正成为人工智能学者要攻克的难题之一。“我们希望人工智能最终能够达到人类智能的水平。现在的所谓智能机器人的智能水平远远没法跟人去相比,三元群体智能是我们实现终极目标的可能途径之一。”
  “也许个体的智能水平不一定很高,但把人和智能机器人通过智联网络连接在一起后,机器可以从人这里学习新的智能,人也同样可以从机器里学习到新的东西。这不是简单的相互学习,当三种类型的智能体在一起不断交互学习的时候,群体智能就会涌现和升级,产生远远超出他们本来的智能。”
  现如今,“三元空间群智智能基础理论与关键技术前瞻性研究”已被列入上海市人工智能科技重大专项先导项目。复旦大学科研团队将针对物理空间、人类社会和信息空间,提出人类直觉+机器感知+加速网络的三元空间群智智能新范式,通过揭示三元群智进化涌现科学规律,探索群智智能激励机制与涌现机理。
  张立华说,当“三元空间群体智能理论”的探索足够成熟,就可以在社会生活的不同领域中实现产业化,如智能交通中的车路协同问题等。
  此外,张立华课题组与清华大学脑与认知科学研究院合作,共同开展直觉智能研究,并提出了机器直觉这一新的交叉学科研究方向,致力于让机器实现类似甚至超过人类的直觉能力,赋予机器以创造性的快速预测、判断、决策、规划能力,以期在真实复杂动态时变场景,如自然灾害、公共卫生等突发事件预判以及创造性科学研究等领域发挥重要作用。
  可以预见, 随着这些新的人工智能理论与方法研究的不断深入, 人工智能将有望突破现阶段理论及应用瓶颈, 朝着通用人工智能的目标更进一步。
  
突破智能芯片技术
  人工智能在某些领域已经展现出比人类更加强大的能力,在一些医疗诊治过程中,利用医疗影像进行诊疗的时候,人工智能甚至会比许多有经验的医生诊断的结果更准确。然而,当智能机器面对其他新的问题时,是否也可以很快地学习并掌握处理的技能?
  答案是:当然可以。
  如今,张立华和他的团队,正在计算机视觉领域围绕多模态智能感知方面在进行研究,为包括无人机、智能驾驶汽车在内的智能机器提供多模态智能感知的技术,让它们学会去感知和理解周围的环境,最终懂得做出最优的判断和决策。
  智能感知的算法非常复杂,不仅要做到实时反应,还要尽量满足各类真实场景低功耗的需求,这对智能芯片提出了更高的要求。在开发多模态智能感知技术的同时,张立华和团队也在对嵌入式智能感知芯片进行探索。
  张立华说,多模态的智能感知不仅仅要基于可见光视觉,也要结合激光雷达、毫米波雷达等传感器技术,把它们获取的信息融合在一起,进一步提高智能感知芯片的精度和可靠性。
  未来,智能芯片就相当于智能机器人的核心大脑,有强大算力,还有足够的智能化水平。不仅要具备强大的感知能力,还要有足够智能的控制决策能力,他把它称为智能计算与控制芯片,这将是一款完全面向机器人和一些智能无人系统的全新的芯片。“国内的芯片技术还相对落后于美国等国家,我们正在努力探索,希望实现技术的突破和创新,开发出属于中国自己的嵌入式智能芯片技术。”
  行为识别研究是张立华和团队正在攻克的另一领域。作为国家信息技术标准化技术委员会生物特征识别分委会行为识别工作组的组长,张立华说,行为识别技术有着更广泛的应用领域。比如,在安防中,可以识别检查对象是否可能做出危险的行为或动作。
  在行为识别领域,步态识别是一个热门的研究方向。“哪怕看不见这个人的脸,但如果能找到走路的一段视频,通过分析他的步态特征,就可以大概率地识别出一个人的身份。”如今,张立华和团队正在将行为识别应用于体育运动中,如在花样滑冰或者速度滑冰运动中,运动员的动作、姿态是否标准,就可以通过行为识别技术甄别,从而进行智能化的训练分析。
  在人工智能领域,脑机交互技术被誉为一项改变未来的技术,在“三元空间群体智能理论”研究中,脑机交互技术的突破将起到决定性的作用。“脑机接口就是通过解析人的脑电波信号,可以识别出人的意图,包括在脑子里思考的语言。比如,我可能想了一段话,但我并没有说出来,通过脑机交互却可以将这些信息提取出来。”
  张立华说,未来的脑机交互技术将真正颠覆现有的人机交互方式,人类和机器人可以通过脑机解码实现思维的联通与交互。“人类和机器人之间,不再需要键盘,通过脑机交互,人类的想法就可以自动传输给机器人。”
  
教会机器友好向善
  人工智能的全球竞争已经拉开了帷幕。在中国,人工智能已经有了良好的发展基础,但涉及芯片等核心部件,仍受制于人。
  在张立华看来,复旦大学成立智能机器人研究院,就是希望打破这一局面。围绕突破国际智能机器人领域的战略性、基础性、前沿性等相关重大科学问题,以智能计算、智能芯片、智能机器人及应用工程的交叉为突破点,以产业需求和包括机器人国家重点研发计划等重大任务为牵引,研究智能机器人信息处理与控制、核心器部件、系统集成与应用等理论与技术,并应用于智能医疗机器人、智能工业机器人、智能服务机器人的研发和产业化,最终致力于形成全自主知识产权的系列智能终端和以机器人为智能终端的新产业研发经济模式。
  团队成员之一的董志岩博士毕业于吉林大学,在研究生阶段曾长期跟随已故著名科学家黄大年进行无人机控制方面的研发工作。彼时,张立华也正在与黄大年团队密切合作,负责研发一个以VR虚拟现实来辅助分析地质空间结构的技术。正因为这一交集,2018年,董志岩加入了张立华的团队,并在其中负责智能感知与控制以及集群控制等方向的研究;负责脑机交互的团队成员康晓洋博士毕业于上海交通大学,瑞士洛桑联邦理工学院博士后的经历使他认为,神经与脑机接口器件在智能机器人领域大有可为;陈迟晓博士则毕业于复旦大学,主要负责人工智能芯片研发的他认为,芯片的开发是中国的战略需求,无数的中国智能科学家都在激发着自己的创新能力。
  张立华说,依托国家的强大力量之上,他和团队将着眼于未来世界的发展,将智能尖端技术在中国实现产业化。他们未来的规划是,在全息群智与机器直觉基础理论与一系列关键技术前瞻性研究的基础上,致力于推动新一代人工智能和智能机器人的发展,同时希望能够继续在人工智能行为识别等领域继续突破,在算法上有进一步的发展。
  让张立华期待的是,一旦真正能够在人工智能理论与算法上有所突破,也就意味着中国的智能芯片也将实现功能与设计上的创新。
  环境感知能力、自主控制决策能力、智能芯片技术……不止张立华的团队,全球的智能机器人科学家,都在致力于提高机器人的智能水平。
  《失控:机器、社会与经济的新生物学》一书中,讲述了未来的世界将是一个生物与机器联姻的时代。在全新的时代,我们人类该如何理解机器?又如何认识我们自己?尽管智能机器人距离真正能够实现自主决策,仍有很大的距离,但人类对于未来是否会被机器替代或杀死的恐慌,在社会上也被广泛讨论。
  人工智能学界和业界的普遍观点认为,人工智能要想发展到能够达到甚至超过人类智能的水平仍需要一个长期的过程。“在还没到这个阶段前,很难去判断人工智能会产生怎样的影响,但现阶段我们可以把人工智能用好。”张立华说。他认为,人工智能是通过与环境的交互而不断学习的,这其中也会包括人的道德观念。人类在设计智能系统的架构时,就可以让智能机器人学会向善,让其先天具有从善的倾向或是意图。在张立华的世界中,人工智能的未来是充满智慧与美好的,作为站在产业与科学前沿的学者,他要做的就是让全人类尽快和他一样,一起感受与创造这个美好的未来。
  
  

分享到:
杂志
本期封面

2024年2月

上一期 下一期