欢迎您登录科学中国人官方网站!!
新浪微博|网站地图|联系我们
沈琳琳:科研路上的孤独与坚持

来源:  发布时间:2016-07-26

本刊记者 张笑笑

 

    
  2016年3月,AlphaGo和李世石的世纪大战点燃了大众对“人工智能”的热情和讨论,“机器学习”“深度学习”等专有词汇一时间倾泻而来,它们之间到底有何区别?
  深圳大学计算机与软件学院教授沈琳琳介绍说,人工智能是一个愿景和目标,机器学习是人工智能范畴下的一种工具,深度学习则是机器学习里面一个分支,强调的是所使用的模型。交谈中,沈琳琳无不流露出对这个新兴领域的喜爱。而他主攻的图像处理和模式识别就属于人工智能的重要组成部分。
  
结缘“Gabor小波”
  
  20世纪初,一个名叫Dennis Gabor的人提出了“Gabor函数”的概念,从此人们用他的名字来命名使用该函数的小波,即Gabor小波。那时,Gabor小波还只是一维的,也并没有应用于识别领域;后来经过发展,它提升为二维。直到1994年,英国剑桥大学约翰?道格曼使Gabor小波的发展产生了质的飞跃。他用Gabor函数跟猫的视觉皮层的响应函数做比较,观察猫在看东西时皮层是如何兴奋的,以及神经元兴奋响应的函数。研究后他发现,二者很像,这说明用Gabor小波函数分析图像是有生理基础的,于是他开发了第一个虹膜扫描及辨识的算法,并申请了专利。
  “Gabor小波应用的很成功!”2002年,沈琳琳受英国政府海外研究奖学金资助远赴诺丁汉大学攻读博士,主要从事人脸识别研究,那时他用到最多的方法就是Gabor小波函数,“用这种方法来提取特征,人脸识别准确率很高”。初获成功点燃了沈琳琳的兴趣,他开始阅读大量的文献,随着研究的深入,他发现Gabor小波性能很好,但问题同样存在——计算量比较复杂,特征维度很高——计算效率低。“当时我做了一个重要的工作就是找到一个方法,通过特征选取,把不重要的去掉,使特征维度缩短,从而加快提取的速度,最终达到又准又快。”他对采用Gabor特征的二维人脸识别方法进行了全面、深入的总结,对不同方法的思想、原理及其优缺点进行了归纳分析,通过互信息和Boosting算法对小波的位置、中心频率以及方向进行选择,最后只采用其中关键的数百个特征进行识别,从而在准确性降低很少的情况下大大提高了识别系统的效率。研究成果“A review on Gabor wavelets for face recognition”发表于《Pattern Analysis and Applications》杂志,目前据Google统计被引用次数已达362次;研究成果“MutualBoost learning for selecting Gabor features for face recognition”发表在《Pattern Recognition Letters》,目前据Google统计被引用次数已达101次。
  博士期间,沈琳琳获得了“国家优秀自费留学生”奖励。毕业后,他进入英国诺丁汉大学医学院担任Research Fellow。诺丁汉大学因核磁共振仪而闻名。2003年,美国伊利诺大学香槟分校化学系教授保罗?劳特伯与英国诺丁汉大学教授彼得?曼斯菲尔因在核磁共振成像技术方面贡献重大,获得诺贝尔生理学或医学奖。沈琳琳也自然投入到大脑核磁共振(MRI)图像处理和基于MRI图像的大脑疾病分析研究工作中,参与多个基于Gabor小波的医学图像处理项目。所谓的“核磁共振成像”就是将人体置于特殊的磁场中,用无线电射频脉冲激发人体内氢原子核,引起氢原子核共振,并吸收能量。在停止射频脉冲后,氢原子核会按特定频率发出射电信号,并将吸收的能量释放,被体外的接受器收录,经电子计算机处理获得图像。这是前期工作,而沈琳琳所要做的是后期处理,“拿到核磁共振的图像后,我需要做一些图像处理,医生再在这基础上比较正常和患某种疾病的大脑的异同,分析疾病的原理。”
  
从二维到三维
  
  提到图像处理,一定离不开“模式识别”。模式识别是一个大领域,可识别的内容有很多,比如图像、语音等。“图像的来源很广泛,如摄像头拍照、医学X光扫描等,但不论设备是什么,最后得出的都是图像”。得到图像后,下一步就要开始理解图像。如何理解?这涉及到“人是如何看图像的”。早期,犯罪嫌疑人在纸上印下自己的指纹印,由法官凭借肉眼判断两个指纹是否为同一人。这是最原始的识别。随着科技的日新月异,技术愈发可以解放人力,简言之,沈琳琳的研究内容就是设计一个“机器”取代人眼,从而把图像内容识别出来。这需要他学习人类观察事物的方法,掌握不同领域的专业知识作为基础。纵观全局,这其实是一个输入和输出的过程,沈琳琳的任务就是中间过程中的转化连接。
  后来,他在对Gabor小波抽取信号特征机理进行深入研究的基础上,结合核方法、信息理论和支持向量机,构建了高效而鲁棒的人脸、掌纹、指纹以及硬币识别系统。
  “我想把所做的研究与实际产业进一步结合,在英国只是做纯粹的研究,产业结合没有太多的机会,而且文化不同,结合的难度也比较大。”于是,在2006年沈琳琳结束海外漂泊,回国加入深圳大学计算机与软件学院。
  一个人在国外,远离亲人又面临着文化差异,困难程度可想而知,沈琳琳坚持了过来。回国后,他依旧举步艰难。由于错过了申请硕士生导师的时间,沈琳琳没有自己的学生,做事情都只能靠自己,一个人写申请书,一个人做研究,一个人敲代码,“开头很难”,话语间仍能体会他当时的艰辛与酸楚。“做科研最重要的是坚持”,因为始终如一的信仰,沈琳琳咬牙度过了最难的开创期。
  在深圳大学,沈琳琳延续了在国外的研究内容,希望对一些固有问题提出新的解决方法。“比如有遮挡、光照暗,人脸识别就会受到影响,准确率低”。他的第一个项目国家自然基金项目“基于过完备感知模型和稀疏表示的有遮挡人脸识别研究”意在解决这一问题。“但是这个方法解决问题的同时自己本身也存在一些问题——字典计算量比较大,不容易找出解”,对此他申请了第二个国家自然基金项目“过完备字典自适应优化理论及应用研究”。就这样,沈琳琳受“问题驱动”意识影响,不断地发现问题、寻找解决方法。
  当时Gabor小波还主要用于二维图像,“在二维图像上效果那么好,能不能用到三维图像上?”于是沈琳琳开拓性地将三维Gabor小波应用于三维大脑核磁共振图像配准以及高光谱遥感影像分类领域。他提出了一种基于三维Gabor小波的配准性能评判方法,即通过对配准后三维MRI图像的局部结构进行分析,可以快速、客观地给出性能指标。方法能广泛应用于配准算法的选择、参数选取,最终推动基于三维MRI图像的大脑疾病分析技术的进步。研究成果发表在当时影响因子为4.3的JCR 1区期刊《Medical Image Analysis》上。后期,他又通过三维Gabor小波和高光谱数据的卷积,抽取影像每个像元在空间-光谱联合空间内的局部变化特性。实验发现,“多个不同小波抽取的特征在融合后,能够很好地代表象元在三维空间内的局部信号变化”。后续工作对三维Gabor特征进行了进一步筛选,在保持高准确率的同时,大大提高了系统效率。研究成果陆续发表在影响因子为3.5的JCR 1区期刊《IEEE Transactions on Geoscience and Remote Sensing》。
  
梦想照进现实
  
  随着工业合作的深入发展,沈琳琳有越来越多的机会实现产业化愿景。2011年,沈琳琳收到一份邀请。这是一家生产医用显微镜和硬件的公司,其产品主要销售给医院用做疾病诊断,比如验血——加入抗原、抗体后在显微镜下观察不同的反应,以判断是否可能出现某种疾病。过去,整个过程都依靠人工使用显微镜,这样就造成检测员工作量很大,准确率和效率也都受到不同程度影响,因此,他们就提出能否有一个软件自动把反应类型分类。
  “他们有需求,我们就合作”,沈琳琳接受了这个挑战。殊不知,那时世界上做这类研究的人还很少,因为做细胞图像有一个特点——没有数据做不了研究。沈琳琳因为和公司合作,就有了获取图像数据的来源,这样,他才能顺利地做下去。
  两年后,检验成果的时刻终于来到。IEEE国际图像处理会议(ICIP)组织了一场“国际荧光细胞图像分类大赛”,沈琳琳延续先前工作,在词袋框架下对基于灰度排序的局部特征字典进行了研究,通过聚类对密集采样获得的局部纹理特征字典进行学习,将在该字典上的表示用直方图统计代表整体图像,最后和空间金字塔方法相结合用于对显微镜观察到的HEp-2细胞荧光图像进行自动分类。比赛最后,沈琳琳的算法击败了来自美国、澳大利亚、日本、法国和意大利著名大学的13支参赛团队,以最高的准确率获得冠军。研究成果也发表于模式识别领域知名期刊《Pattern Recognition》 。
  渐渐地,沈琳琳的工作走上正轨,他也有了自己的学生。说起他的第一个研究生,沈琳琳记忆颇深。“他是专科生升本科生,基础不是很好”,但通过3年的努力,最后拿到了一家互联网名企公司的录取单。拥有这样傲人的成绩,除了学生自身的刻苦,沈琳琳也功不可没。作为老师,他总是更多的投入精力和时间去训练学生,通过带他们做科研、做项目提升技术水平。授人以鱼不如授人以渔,“在培养其技术能力的基础上要有针对性的培养他们独立思考,不是把技术简单的告诉他,而是教会他如何获得这个技术,如何思考、如何解决问题”,表达与沟通也是他看重的能力。传道授业,沈琳琳可谓是用心良苦。
  回忆起当年在上海交大读硕士,沈琳琳感概道,“那时还没有数据库,网络也不发达,查论文很麻烦,只能去图书馆打印”。后来读博士,一切就都变得方便,他有机会接近最新技术,同国际学者交流接触。以至于到如今,沈琳琳更加珍惜这个时代所创造的机会,可以让像他一样有追求有激情的科研者践行自己的科学梦。未来,沈琳琳期盼有一个更大的突破——和公司达成合作,产品能有更多人使用。
  电话那端,沈琳琳的声音有些低沉,甚至有些疲惫。在沈琳琳看来,科研就是一条一旦选择了就不能停下脚步的路,唯有源源不断地探寻下去,才可能看到彼岸的缕缕曙光。然而在路途中,会经历独孤、困苦、失望,也会有欣喜与激动。这一切都需要自己默默承担下,“在未来的某一天,一定会感谢当年努力奋斗过的自己。“
  
  
专家简介:
  沈琳琳,深圳大学计算机与软件学院教授,广东省教育厅中英合作视觉信息处理实验室主任、深圳大学计算机视觉研究所所长、博士生导师、英国诺丁汉大学计算机学院荣誉教授。上海交通大学学士、硕士,英国诺丁汉大学博士。
  作为负责人主持国家自然科学基金项目、广东省自然科学基金项目和深圳市科技计划项目20余项,作为第一发明人获发明专利2项。发表学术论文100余篇,其中SCI检索50篇,EI检索80篇。据Google Scholar,论文总被引用次数2032,H指数20。担任《ISRN Signal Processing》编委,《IEEE Trans. on Image Processing》《IEEE Trans. on Multimedia》《Pattern Recognition》《Image & Vision Computing》和《Computer Vision & Image Understanding》等国际重要期刊的审稿人。
  现为广东省高校“千百十工程”培养对象,深圳市高层次“地方领军人才”,深圳市海外高层次人才,深圳市十佳青年教师。曾获2008年深圳市科技创新奖、2012年深圳市自然科学奖、2013年广东省科学技术奖、2015年中国电子学会科学技术奖、2010年国际期刊《Image and Vision Computing》最多他引论文奖。2015、2016连续2年被爱思维尔出版社评为计算机学科“中国高被引学者”。
    

分享到:
杂志
本期封面

2024年3月

上一期 下一期