欢迎您登录科学中国人官方网站!!
新浪微博|网站地图|联系我们
杨云:激情与稳重并行

    发布时间:2015-10-28

本刊记者  汲晓奇


   最近,云南大学副教授、硕士生导师,杨云迷上了一种“新鲜玩意儿”——用神经网络的算法来进行自动编曲。这位痴迷摇滚的青年科学家研究的主要方向是时下热门的机器学习。“我的理想是工作和生活能够更好地融合在一起,虽然有时候不能完全实现。但我尽量把我的工作作为业余生活的一部分,进行业余生活的同时又能回馈我的工作。”
   不大的年纪,老成的声线;活跃的思维,严谨的逻辑……各种出人意料的“冲撞”交织成杨云,一个激情与稳重并行的“80后科学家”。

时间序列,数据挖掘中的最具有挑战性的研究方向之一

   “说到大数据我就兴奋。”与很多痴迷于计算机的“极客”一样,杨云说到自己的研究对象条件反射般地肾上腺加速。这种快速的反应与他所从事的研究的特征非常契合。
   20世纪80年代末,在那个计算机还没有普及的年代,当年幼的他在同学家里第一次与计算机“深情相遇”的时候,怀着一种“膜拜”的心情,从此笃定要走上研究计算机这一新鲜事物的道路。那时候的他,并没预料到多年后的今天,他选择的这一专业会以怎样惊人的速度渗透到我们生活的每个角落。
   信息爆炸时代,大数据统计被应用于经济、政治等领域,成为备受推崇的决策工具。甚至有人说:得大数据者得天下。当海量的数据充斥我们周围,就像一座巨大的矿井,我们如何从中挖掘出对我们有用的、有价值的数据以帮助决策?这就是数据挖掘的价值。
   在众多的数据中,有一类数据它的性质随着时间的变化而变化,例如股票、气象、多媒体、人口普查数据等。由于这一类数据本身具有非常复杂的特性,如:复杂时间相关性,高维度,海量性、噪声干扰,使得传统的挖掘技术无法获得较为理想的结果。而这,就是杨云和他的研究团队所关注的研究对象。
   “2005年,香港中文大学的研究者做了一项研究报告,将时间序列数据挖掘列为数据挖掘中最具挑战性的十大研究方向之一。2012年,奥巴马政府投资2亿美金启动“大数据研究和发展计划”,并在2013年发布了第二轮大数据研究项目,其中白宫科技政策办公室建立的流行病“天气预报”项目,旨在利用大数据方法尽早对流行病作出识别和预测,以便预做准备,减轻症状,其本质就是时间序列数据挖掘……”从杨云充满激情的讲述里,可以感受到他对自己的研究对象那种痴迷的热情。也正是这种热情,让他在直面科学难题的时候依然能体会到探索的快乐。
“三个臭皮匠顶过一个诸葛亮。”杨云笑着如是比喻自己在时间序列数据研究领域里的创新成果。
   “因为时间序列数据的复杂度很高,根据算法整体不同的情况会产生不同的聚类分析结果,甚至同一种聚类算法对同一种时间序列进行数据分析也会产生不同的结果。我们没有一个绝对衡量其好或者坏、对或者错的标准。所以单一的传统的序列算法结果并不理想。那我就把多样的结果汇合起来,看大家共同的趋向找出共识的内容作为算法的最终结果。这,就是我混合性算法最早的初衷,它实际上来源于传统的集成方式。”“相当于是一个汇总的方法,白猫还是黑猫好?用‘投票选举‘的模式来加以解决。”对于自己的研究对象,杨云总是能找到合适而有趣的方式来对其进行描述。
   “融合”“创新”是他擅长的制胜“法宝”,带着这两种思路和方法,在英国曼彻斯特大学攻读博士学位期间,杨云巧妙地把传统的时间序列数据挖掘的聚类分析与集成学习算法融合在一起,有效地提高了时间序列数据聚类分析的精确度和稳定性。之后通过不同的时间数据处理手段(如:proximity-based, model-based, feature-based),他先后提出一系列高性能的聚类集成学习算法,包括基于多特征表示的加权聚类集成学习模型;基于隐马尔可夫模型(Hidden Markov Model)的聚类集成学习模型;基于混合采样与完整信息融合的聚类集成学习模型等。
   相关成果先后发表在IEEE Transactions on Neural Networks and Learning systems,IEEE Transactions on Knowledge and Data Engineering, IEEE Transactions on Systems, Man, and Cybernetics(part C)等国际顶级学术期刊以及相关领域的国际权威学术会议IEEE WCCI-IJCNN上,获得业界广泛关注和好评。
   陶醉在时间数据环绕成的科学世界里,杨云用自己对科研的热情和创新思维收获了不错的科研硕果。由于突出的科研潜质与学术表现,他入选英国政府资助的海外研究生奖励计划。之后在英国萨里大学从事博士后研究工作和在英国曼彻斯特大学任教学助理。

彩云之南,我的家乡

   2014年,带着满身所学,杨云以人才引进形式全职进入云南大学工作。至此,他回到了家乡,回到了自己父母的身边。
   “父母在,不远游。”杨云如是坦言自己回国的主要原因。作为家中独子的他,在很小的时候起就能感念父母的恩情。为支持杨云的理想,他的父母在他念书的时候就为他购置了人生当中第一台电脑,在那个年代,几乎是倾尽家中所有。为了给他更好地教育,在杨云19岁的时候,就忍痛割爱将他送出国外去历练,处处、种种都饱含着深情。如今,父母垂暮,思念渐深,是到了该尽孝道的时候了。加之国家相关领域的飞速发展,使得杨云对回国之后的未来充满信心。恰在这个时候,彩云之南巍巍学府——云南大学抛过橄榄枝,他毫不犹豫地踏上归程。
   后来事实证明,他父母的思虑是正确的,漂泊海外十几年,让原本生活在蜜罐当中的杨云不仅获得了居于世界前沿的知识,最重要的是学会了独立。
   难忘出国头几年,年纪尚浅的杨云连最基本的语言关都还没过。连生活起居中日常的沟通都还存在问题,更别说在学校里接受纯英文的教学了。那段时间是他最孤苦,压力最大的时光。为了让自己尽快适应起来,他强迫自己在短时间内把语言能力迅速提高,到处与人沟通,夜晚恶补英文单词。功夫不负有心人,通过一年时间的学习,他在沟通上已经能基本实现畅通无阻。
   语言关之后就是学习关。与很多在国内接受完高等教育再出国的学子不同,杨云从本科起就置身海外学术殿堂,不可避免地要面对更多教育理念、教学方式方法的不同。一路攀爬象牙塔直到博士后,从通信信息技术专业到多媒体再到机器学习,不同的专业不同的领域,每跃上一个台阶就会有很大的提升,但也会面临很多不同的挑战和考验。尤其是硕士还要分两个阶段进行,从普通的应试向研究转型,杨云慢慢学会了该如何独立地去从事科学研究。成长的过程有过痛苦也有过快乐,也曾想过要放弃,但庆幸地是,在同学和导师的激励和影响下,他坚持走完了全程。如今回头看,一切都是值得的。
   虽然回国的时间并不长,但杨云在云南大学各方面的工作都进展得十分顺利,相关领域的研究开云南大学之先河。性格温和谦逊的他虽然在海外多年,但很快就又融合到现在的集体中来,左右逢源游刃有余,深受同事和学生的喜爱。
   回国后凭借多年在海外积累的知识和技能,他先后主持国家自然科学基金项目1项,参与国家自然科学基金项目1项,主持教育部留学回国人员科研启动基金项目1项,主持云南省软件工程重点实验室开放基金面上项目1项。此外还担任IEEE Transactions on Neural Networks and Learning systems, IEEE Transactions on Cybernetics,Pattern Recognition等国际知名学术期刊的审稿人。科研仍是杨云工作的“重中之重”,他希望自己能够延续以往的研究内容,并在原来的基础上出一些新成果;同时又希望能够扩展一些新的、居于国际前沿的研究方向,例如深度学习等。希望在相关领域有一些高质量学术论文发表。
   与科研并行的是教学工作。作为一名青年教师,杨云在跟学生相处的时候更多地扮演的是亦师亦友的角色。一方面他希望自己和学生的关系是一种对等的关系,“我们不是一种上下的关系,而是一种互相启发式的关系,我能够给他们引导,同时他们的回应常常能够给我启发”。另一方面,作为师长,他希望能够将自己多年在外的所得所感全部传授给他的学生,包括对科研的痴迷和狂热;在困难面前需要耐心和恒心等。因为受海外教育的影响,他常常给予学生的是一种启发主观能动性式的教育,授之以鱼不如授之以渔。
   现在,杨云一个人承担着五门基础课程的教学,还有一门课程准备开课,教学大纲已经成型只待学校回复。因为相关领域是云南大学的研究空白,作为一名骨干,他同时承担起学科建设的工作,包括寻找好苗子,培养骨干教师,组建实验团队等。各方面工作都进行得井井有条,甚至下一步该如何走,在杨云的脑子里都已经有了清晰的规划。“我们处在信息爆炸的时代,不管国家还是学校,对相关领域都非常支持。如何在这样的大环境下使得我们学科研究尽快走到国际前沿,更加具有前瞻性;如何把科研变成有实用价值的成果,这些对我来说都是更高的目标……”因为身上肩负重任,这时候的他较于以往,激情之外,又多了几分稳重。

“典型80后”

   “典型80后”,这是杨云给记者留下的最深印象。他在父母的关爱和呵护下长大,没有过多上一代物质生活的羁绊和顾虑;他和他的同伴一起率先跨入中国信息新时代,接触前沿,探索新生事物;他对工作和生活充满激情,随心所欲,彰显个性。如今,“80后”杨云已然走进社会,肩负起家国重任成为有担当的一员。不变的是,他对生活一贯的热情。
   虽然平时工作很繁忙,但杨云总会抽出时间来丰富自己的生活。他的兴趣爱好很广泛:喜欢旅游,喜欢摄影,喜欢美食,平时会自己做菜。看到喜欢的东西都愿意自己去尝试。他还喜欢文学爱好音乐,尤其对摇滚比较痴迷。在英国攻读博士的时候,他还组建过自己的华人乐队。会写歌,有自己的淘宝计划……
   “一味地把一个状态在一种环境中呈现会很容易产生疲劳,而且在思维模式上会很容易陷入一种死板和僵硬。所以,我把这些兴趣和爱好当作是我工作的调剂。适当放松调节,有益于帮助我在科研工作中找到需要的灵感,可以把其他领域有意思的东西与我们所研结合起来。”这也是他最近痴迷于用神经网络的算法来自动编曲的原因。

 

分享到:
资讯