欢迎您登录科学中国人官方网站!!
新浪微博|网站地图|联系我们
李明:坚守理论高地 独领AI鳌头

来源:  发布时间:2017-07-28

——记加拿大皇家学会院士、滑铁卢大学教授、宁波中国科学院信息技术应用研究院首席科学家、薄言信息技术公司董事长李明博士
  
本刊记者  马丽娜  黄 健

  
    
  2016年3月,韩国首尔举办了一场特别的围棋比赛——围棋人机大战。韩国围棋九段棋手李世石与人工智能(AI)围棋程序“阿尔法围棋”(AlphaGo)之间进行了五番棋比赛,比赛采用中国围棋规则。最终,人工智能AlphaGo以总比分4:1战胜人类代表李世石。
  人工智能AlphaGo战胜人类,作为围棋爱好者的李明十分关注。早在10年前,他就和自己的团队以独特的预见性眼光,展开了人工智能机器人的研究,并重点围绕“聊天对话”进行深入挖掘。而今,他穿梭于太平洋和大西洋之间,奔波于中国和加拿大,2013年在加拿大和宁波创建了薄言信息科技有限公司,并在中国科学院信息技术应用研究院(简称:信研院)担任首席科学家。他带领一支特殊的团队成功开发了RSVP自然语言智能服务系统,研制出“薄言超脑”聊天机器人——薄言豆豆。和AlphaGo一样,薄言豆豆的成功也是基于“深度学习”技术的研究开发。在人工智能的道路上,李明始终坚信“唯有理论的进步才能给人工智能带来质变”。
  
预见:十年之前的设想
  采采?苡,薄言采之。采采?苡,薄言有之
  “薄言”一词来自《诗经》,在句中理解为发语词,起补充音节的作用,引申意为人们在大自然里辛勤愉快地劳作收获。而李明带领团队创建的宁波薄言信息技术有限公司(RSVP Technologies Inc.),正是取其深意。他们希望让全世界的用户和他们一起在机器人的深度自然语言理解上回归自然。
  2013年,宁波薄言信息技术有限公司成立,入驻宁波国家高新区, 并得到宁波市政府(3315计划)和宁波中科院信息技术应用研究院的大力支持。李明介绍说,薄言团队的核心成员包括王靖波、熊琨、崔安颀、张泽峰。这个团队不同于其他团队,它是一个具有极强技术背景的人工智能团队,成员来自于康奈尔大学、哈佛大学、清华大学、北京大学、中科大少年班、滑铁卢大学以及国内外顶尖院校优秀毕业生。团队与加拿大滑铁卢大学、中国科学院计算所、清华大学等都有深入的高水平项目研发合作,并致力于自然语言处理研究及广泛应用。目前,团队已取得多项研究成果,包括语义理论、中英文问答系统等,被众多世界顶级学术期刊和学术会议收录并获最佳论文奖。
  作为创始人和团队的核心人物,李明的身份更不简单。他是加拿大皇家学会院士,ACM/IEEE Fellow,加拿大最高科学奖Killam Prize获得者, 滑铁卢大学讲座教授,University Professor,清华大学长江学者讲座教授,宁波中国科学院信息技术应用研究院首席科学家。1980年,李明以高中学历就直接考上了中国科学院出国研究生,到美国留学,获得康奈尔大学的计算机博士学位。在执教滑铁卢大学之前,他曾在美国俄亥俄州立大学、哈佛大学和约克大学担任过教职。他的研究成果所产生的影响已经超越其计算机领域,并应用在计算机科学、生物信息、哲学、物理学、统计学等方面。他领导开发的PatternHunter、ExonHunter等生物信息学数据分析软件已被业界广泛接受。他运用深度神经网络, 信息距离理论以及自然语言理解新技术开发了新一代聊天机器人——薄言超脑,被视为世界一流成果,目前已开始为多家机器人提供服务。
  李明在计算机的几个领域包括现代信息论, 计算生物学, 算法分析, 以及机器学习都做出了杰出贡献是世界级专家。比如分析平均算法复杂性。程序好还是坏,快还是慢,需要分析它的平均速度,这是一个大问题。“做算法平均复杂度分析非常难,如果对每一个输入都去分析再加起来平均,工作量难以想象。”而李明就发明了一种分析平均复杂度的新方法: 如果能构造出一个有代表性的输入,只分析算法对这一个输入的时间复杂度,这就能代表大多数,也就有了所谓的平均复杂度。但这里有两个需要解决的问题,首先是有没有这样一个有代表性的输入,其二能不能找到。而李明就是利用Kolmogorov复杂性最终找到了这么一个有代表性的输入, 只要分析这一个典型输入,结论就能代表大多数因此得到平均复杂度。使用这个方法李明和他的同事姜涛和Paul Vitanyi解决了一系列计算机领域几十年没有解决的问题,对计算机理论产生了重大影响。他当选院士的评语这样说道,“他是一位有国际影响的领头人,在生物信息学算法和软件开发方面,和同事一起,发展了大量的理论和算法,在计算生物学书籍和各种软件包中被广泛使用。”
  “我们做聊天对话智能机器人以及自然语言处理已经做了10年了。”李明说。10年前,谈智能聊天机器人还显得有些望尘莫及,但李明在那时就认准了要在人工智能领域干一件大事。他坚信“人类高级智能的第一表征是语言和语义理解。”2006年,在加拿大,李明就以敏锐的眼光洞察到了大数据的到来,他认为是时候做对话机器人了。但在当时,对话机器人并不流行,大部分人都对之持怀疑态度。尽管暂时没人相信,没人支持,但他还是坚持自己的想法。有了想法,便立即付诸实施。他就联合清华大学的朱小燕教授组织了一个团队一起做项目和计划,并发表了重要论文,此时李明只有一个想法,“一定要把事情干起来!”
  “很多基础的工作也都是那个时候就开始做的。现在公司一半在加拿大一半在宁波,两地同步进行。”短短几年时间里,李明以独特的预见性眼光领导发展了RSVP自然语言智能服务系统——薄言超脑,巧妙地运用了他和同事发明的信息距离理论,解决了许多关键性技术难题,把智能聊天机器人的“深度学习”推向了一个新高度。漂洋过海,不远万里,奔波于加拿大和宁波之间,李明笑谈:“我们很幸运地处在这场人工智能技术革命的风口浪尖上,有这样为社会做贡献的机会,千载难逢。采采?苡,薄言予之,反馈社会,薄言当仁不让。”
  
理念:人工智能革命从“深度学习”对话开始
  人工智能是一门极富挑战性的科学,从事这项工作的人必须懂得计算机知识,心理学和哲学。它由不同领域组成,其目的就是让计算机这样的机器能够像人一样”思考”,但这可不是一件容易的事情。
  人工智能的应用领域也很广泛,比如问题求解、逻辑推理与定理证明、智能信息检索技术,还有自然语言处理。自然语言的处理是人工智能技术应用于实际领域的典型范例,经过多年发展,人类在这一领域已获得了大量可喜成果。计算机系统如何以主题和对话情境为基础,通过储备大量知识,生成和理解自然语言?这是一个极其复杂的编码和解码问题。“人类的高级智能,是从说话开始的。”李明说,“语言赋予了人们组织社会结构,思考和抽象的能力。因此,人工智能的革命,也应该从学习语言开始。”天降大任,李明和薄言的研究团队认为让他们的研究惠及大众是他们的社会责任,这是一个研究者的终极目标。
  最近,“深度学习”好像一下火起来了。李明坦言,一开始自己和团队并不敢设想他们的运气。但他始终清楚,“智能机器人的关键是对话,一定要把对话做好,一开始就想做好对话,这是我们的初衷。”而做好对话的关键,离不开人工智能对自然语言的深度学习。“深度学习是机器学习研究中的一个新的领域,其动机在于建立、模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,例如图像,声音和文本。”而在自然语言处理上,深度学习已经在语音识别和机器翻译方面发挥重大作用,下一个目标就是语义理解。
  沿着这条思路,经过10年的积淀和磨练,李明带领的薄言团队迎来了一个新生命——薄言豆豆(读者可以加微信公众号“薄言豆豆”来使用)。豆豆是目前世界上聊天机器人中最出色的。说到豆豆,那可是有的聊,毫不夸张地说,你还不一定能聊得过它。你问豆豆:“今天天气怎么怎么样?”它不但能准确告诉你今天的日期、温度、风力,更会给你提供出行意见以及穿衣指数等外延信息。聪明的豆豆不但知道今天天气情况如何,更知道明天、后天甚至大后天或用历史数据预测未来天气。你问豆豆:“怎么才会有幸福?”豆豆会在“深思熟虑”后给出建议:“幸福就在你身边。”似乎任何问题都难不倒豆豆,即使是对人生的思索,它也能给出自己的理解。豆豆已不再是简单意义上的对话机器人,而是真正可以和人类聊天的机器人。
  NLPCC在2015年10月份组织了一个测试,设计了1000个问题以测试中文问答技术。有人用这个数据集测试了当今所有知名的对话机器人,最终测试的结果是:及格的只有豆豆一个(读者也可以通过”薄言豆豆”微信公众号来测试豆豆)。“其他有些机器人可能擅长对话而不关心知识。但是我觉得一个聊天机器人,只会简单对话肯定是不行的。知识就是力量,你要想做好一个聊天机器人,就必须要有大量的知识做后盾。”李明说道。那么,豆豆为什么会这么聪明呢?
  “豆豆内置有薄言超脑”,李明介绍说,薄言超脑是运行在大型GPU集群上的人工神经网络,拥有数十亿神经元参数。它会通过读书、看报,获取新的知识,并通过和人脑相似的多层神经网络,归纳新的概念以及他们之间的联系。可以说,薄言豆豆是一款以深度学习与神经网络为核心技术,语义理解能力领先的智能聊天机器人。但像豆豆这样的机器人到底是怎样学习说话的呢?
  李明讲了一个例子。AlphaGo在跟欧洲围棋冠军樊麾二段下棋的时候,棋力还不到超一流。但是之后的四五个月时间内它跟自己下了3000万盘棋,这中间它的棋力也增加了一至两个子,之后赢了超一流棋手李世石。可见,AlphaGo这3000万盘棋就是一个加强深度学习的过程。
  棋类游戏一直被视为顶级人类智力的试金石,人工智能与人类棋手的对抗一直在上演。AlphaGo下一盘棋后能知道自己是输还是赢,通过输和赢的反馈结果改进自己的价值网络进行加强深度学习。但是“说话”怎么办?怎么判断机器人的话说得是好还是坏呢?李明说:“如果要让计算机学说话,机器人就必须跟自己说话,光自己跟自己说话还不行,还要有一个办法来估计这个话说得好还是不好,这是件特别难的事。”学说话比AlphaGo下围棋难得多。但豆豆的诞生,证明了薄言开始在解决这件“特别难”的事,“这是在一定程度上是利用我们的数学理论做的”。而这个漂亮的数学理论到底是什么呢?
  
坚持:致力于突破人工智能60年难题“语义相似性”
  让薄言豆豆自己跟自己说话,这比下围棋难得多。怎么让一个数学理论教会一个机器人估计自己的话说得好还是不好?
  比如天气问题,可以直接教它“今天天气怎样”是问天气,它学习之后可能可以准确回答出今天的天气状况。但是如果换个问法“今天天气好不好”其实是一个意思。但是,“今天天气不好”只差了一个字就不是一个意思了。对话的内容是无穷无尽的,要穷尽所有的模板,工作量可想而知。“所以这样写模板是行不通的,用关键字当然也不行,太容易出错误,最好的办法是有一个理论:定义什么叫语义相似性,什么东西相似,什么东西不相似。这是我们要解决的问题,也是人工智能60年还没有解决的问题。”对人们说的话该怎么理解,又该怎么回答?这是人工智能亟待解决的问题。
  “但是我希望提出对这个问题的一个另类的解决方法。”李明举了一个例子,豆豆所用的来学习一个句子相似性的LSTM算法,需要考虑样本之间的某种关联,不过最关键的是必须最终确定到底是相似还是不相似。这就必须要有反馈,必须得有一个办法告诉机器人“相似”还是“不相似”。
  该怎么反馈?“这需要设计一个最基本的理论概念——语义距离。”语义距离是个基础概念,但是人工智能做了60年仍没有人知道怎么计算怎么定义。因为语义距离是不可计算,不可定义的。大家都知道,“今天天气怎么样”和“今天天气好不好”,这两句话的语义距离是0。那怎么定义一个数学理论来解决这个问题呢?
  “我们的数学理论是从冯·诺依曼热力学公理开始的。”李明说道。首先要定义信息距离,而信息距离很抽象不能用传统定义。该怎么办?考虑X、Y为任何两个信息载体, 比如一篇文章, 一个基因组, 一段程序, 甚至一个抽象概念“爱情”, 现在需要计算两个信息载体之间的距离。怎么算?李明作了一个简单易懂的解释。信息距离的定义从冯·诺依曼热力学公理出发, 就是转换X、Y所需要的最小能量,按照冯·诺依曼的说法也就是转换他们的最短程序的长度或比特数。即转换X、Y所需要的最小的能量,就定义为X、Y之间的信息距离。李明和他的同事们定义的信息距离现在已经广为世界学术界接受, 被数千篇论文引用和应用, 成为信息时代的现代信息论 [见:Ming Li and Paul Vitanyi: An introduction to Kolmogorov complexity and its applications, 2008年第三版,和 C. Bennett, P. Gacs, M. Li, P. Vitanyi, W. Zurek: Information Distance, STOC’1993]。
  李明说:“我们进而从数学上证明了我们的信息距离一定比其他任何合理的距离都好!”找到了信息距离,就可以用信息距离来近似语义距离。语义距离虽然不可计算甚至没有定义,但是可以通过信息距离近似。因为近似计算信息距离只要压缩编码就可以了,在自然语言方面基本上可以用。这样就从理论上提供了一个近似语义距离的方案,李明带领薄言团队给豆豆提供了一个坚实的理论。
  
坚守:唯有理论进步人工智能才有质变
  现在的人工智能和自然语言处理进入了一个快速发展的轨道,最初大家用的都是最容易实现的技术,也最容易想到的:从一开始的关键词匹配的方式,到后来慢慢出现根据语序结构的模版来判断用户语言内容的手段;如今,横扫整个人工智能行业的深度学习被大量运用到对话机器人的训练中。
  李明说:“人工智能和自然语言处理的进步,首先一定要靠理论的进步,而不应该是工程上的关键字或模板匹配。”他坚信理论基础的建立才是应用进步的基础,也在坚持贯彻着这一理念。一个机器人能根据匹配和搜索关键字回答人类提出的一些问题,但这些工程的方法能力有限。“只有人工智能的理论不断发展,比如现在的深度学习,才能大大提高机器人的‘智能’”。
  “薄言豆豆”首先打破了关键字或模版匹配的传统方式, 它不是一个工程而是一个科学,它基于的理论涉及物理、数学、计算机科学、哲学等学科领域。“薄言豆豆”的“薄言超脑”用了大型的GPU,拥有数十亿的神经元参数,在现代信息论指导下,应用了最先进的数学理论。利用“深度学习”,薄言超脑通过读书、看报、获取新的知识,用与人脑相似的多层神经网络、归纳新的概念以及他们之间的联系。“薄言豆豆”以这些先进理论为基础能够自主学习,更新回答问题的内容。“薄言豆豆”致力于解决的是人工智能60年都没有解决的理论问题——语义相似性。 薄言团队不满足于雇用大量工程师来编写模版,而是从一个漂亮的数学理论开始,首先从方法论上解决问题。李明说:“我们还有一个置信神经网络,强化学习,调整对话逻辑,让豆豆变得更会说话。”
  冯·诺依曼曾说:“只要你把被认为是计算机无法解决的问题描述清楚,计算机就总能找到一种方法解决它。” 这么看来,李明和他的团队对语言的含义和效果给出近似”语义距离”的“信息距离”,或许能成为AI理论未来进步的基石之一。
  作为宁波中国科学院信息技术应用研究院首席科学家,李明正和信研院一起致力于面向应用的以智能感知为核心的新一代信息技术研究开发,助推宁波市智能经济发展和智慧城市建设。信研院是由宁波市政府与中科院共建的公共技术服务平台,2012年成立,对提升宁波区域科技创新能力,推动信息产业、智能经济快速发展,加快经济转型升级,增强宁波城市综合竞争力,将起到重要推动作用。信研院是支撑和引领宁波“新一代信息技术”和“智能制造”战略性新兴产业发展的创新型公共技术服务平台。借助平台优势,今后几年,李明和团队将以智能感知共性关键技术和应用技术为主攻方向,致力于为宁波智能经济和智慧城市建设提供必要的技术积累以及应用经验。通过不同专业方向的交叉结合开展研究,建设“智能大脑”服务平台,以大数据为基础,面向智能产品和服务提供机器学习、深度学习等智能功能服务,助力宁波智能经济发展。
  借助平台优势,今后几年,李明和团队将以智能感知共性关键技术和应用技术为主攻方向,致力于为宁波智慧城市建设提供必要的技术积累以及应用经验。通过不同专业方向的交叉结合开展研究,为实现智能感知技术在有限的资源条件下满足智能化、低成本、绿色节能、用户和环境友好、用户为中心、高效等要求。
  “老老实实把技术做好,让AI在理论上更进一步。”这始终是李明在人工智能研究领域的初衷。他还提到:“在这场技术革命的洪流中, 聊天机器人在两个环境里能会首先成功,一个是中文一个是英文。有语料是关键,中华文化博大精深,拥有上下5000年的历史和丰富的文化及语料以及世界1/4的人口,而只有1500年历史的英文是比不了的。在这场革命里,中文和英文是站在同一个起跑线上。我们坚信一定能做好中文智能聊天机器人,通过训练的机器人将会写文章作诗作曲、琴棋书画。机器人还将给社会带来改变。因为将来: 劳心者治机器人,劳力者机器人。”李明团队也力求在人们的生活领域做出一番成绩,“把薄言豆豆应用到医疗、智能家居、老年陪护、儿童陪护、给教师缺少的偏远山区做辅教……希望能对人们生活有用,给大家的生活带来方便,提高人们的幸福指数。”
  怀着美好愿景,十年磨一剑。李明带领团队用10年做好了一件事,坚守理论高地,力解人工智能60年没有解决的难题。而他最希望的是能跟大家一同见证中国人工智能语言交互处理科技走向世界, 领导潮流,奉献社会。
  

分享到:

杂志
本期封面

2024年10月

上一期 下一期