欢迎您登录科学中国人官方网站!!
新浪微博|网站地图|联系我们
为计算机锻造“火眼金睛”

来源:  发布时间:2017-02-14

——记中科院自动化所“人工智能与机器人教育联合实验室”主任董晶

本刊记者  李晓文

 

如果要问当下最火的概念是什么,答案非人工智能莫属。从科研界到产业界再到资本圈,人工智能就像一团火,燃起了每个人的热情。从类脑,再到各种无人设备,人工智能已经不再是束之高阁的科研成果,而是与每个人都息息相关的话题。

然而,有一种人工智能却并不广为大众所了解。它如同其所深耕的领域一般低调而神秘,它就是视觉内容鉴别研究。通俗地说,这项技术就如同一个“火眼金睛”的侦探,从图片信息的蛛丝马迹中辨别真伪。

中国科学院自动化研究所智能感知与计算研究中心副研究员,自动化所—中科大智“人工智能与机器人教育联合实验室”主任董晶,就是一位为计算机锻造“火眼金睛”的科研工作者。年纪虽轻,但她却已在这一领域拓荒许久,在基础研究的领域心无旁骛地耕耘着。

 

勇立潮头 助力科普落地生花

 

2016310日,围棋世界冠军李世乭与谷歌人工智能程序AlphaGo结束了第一场黑白对决,这场人机大战引发了全世界的关注。就在第二天,中国科学院自动化所与深圳无人机教育机构中科大智共建的“人工智能与机器人教育联合实验室”揭牌成立,同时发布了全国首套无人机科普教程,同样引起国内的广泛关注。

作为实验室首任主任,董晶进入人们的视野。

老家在湖南的董晶,端庄温婉,性格里却带着湖南人与生俱来的爽朗、豪放基因。她先展示了实验室揭牌成立那天,正式发布的无人机科普技术系列教程。“这套面向8?18岁中小学生的教材,旨在培养未来的无人机接班人。”董晶兴奋地说道。种类多,图片、文字详实易懂是这套教材的特点。通过学习教材上的内容,学生可以掌握无人机的组成、飞行原理,特别是对诸如GPS、陀螺仪等应用的了解和熟悉,有助于学生今后自己组装、调试无人机甚至可以进行飞控开发。更重要的是,它能拓宽学生思维的广度,从小培养他们发现问题、分析问题、解决问题的能力。

每年在科学院开展的“公众之光”活动中,中科院自动化所都向公众开放,展出机器鱼、机器人、人脸识别、虹膜识别、类脑等新技术。中小学生在观摩了新技术的演示后,对此产生了极大的兴趣,想进一步了解新技术背后的机制和原理。自动化所为了满足中小学生的需求,特意安排研究员和博士生来进行讲解,但由于内容技术性强,专业性强,中小学生接受起来较困难。“尽管如此,可是他们求知的欲望却有增无减。”孩子们求知若渴的眼神令董晶难以忘怀。

深圳中科大智在培训过程中看到了市场对人工智能的热度,但同时也感到全国相关的科普教育工作,远跟不上人工智能蓬勃发展的趋势。自动化所作为人工智能领域的领军科研机构,在智能技术、信息处理、控制等方面具有国际一流的科学技术和科技人才储备,结合中科大智的市场推广和教育经验,双方一拍即合,“人工智能与机器人教育联合实验室”成立。

据董晶介绍,目前,相关科普课程已经在深圳中学、笋岗中学等学校开设。未来,实验室计划将把生物特征识别、计算机视觉等前沿领域的最新研究成果,研发成面向中小学生,乃至职业教育学生的科普课程和科普设备,依托中国科协、中科院、国家的科普推广项目工程以及遍布全国的科技馆、科普教育中心,为全国青少年科普人工智能知识,为国家人工智能行业培养人才。

“科学研究是一种思想的探索,而科普则是对这种思想的传播。”董晶加入实验室有她自己的愿景,她曾参加过科协和团中央组织的“科普志愿行”和“科技创新行”活动,奔赴偏远地方做科普报告。她说,人工智能一是模仿人,二是替代人,更多的功能则是延伸和拓展人类行为,理所当然也应成为拓展人类思想传播的一种手段和方式。她希望自己的科研成果联同科研思想,在未来通过这种特殊的方式得到进一步延伸。

 

博学笃志 不忘初心潜心研究

 

“人有两种,通才和专才,我本希望成为前者,不是只能一条路走到黑的那种。”但对专业方向的选择上,董晶恰恰是“一条路走到黑”了。热爱科研、热爱科普的董晶于2005年本科毕业于中南大学电子信息科学与技术专业。临近毕业时,由于成绩优异,她获得了学校保送研究生名额。在众多科研机构中,董晶果断地选择了中科院自动化所。时任自动化所所长的谭铁牛,是模式识别领域的领军人物,也是董晶的湖南老乡。1997年,谭铁牛放弃了英国南部美丽城市雷丁的优渥生活,与妻子双双向雷丁大学递交辞呈,带着刚满周岁的儿子,踏上回国路。这个故事对董晶的触动很大,谭铁牛也成为她心中的标杆性人物。慕名来到北京,通过面试,董晶如愿成为模式识别队伍中的一员,从此开启了令她心驰神往的人工智能科研之路。

董晶介绍,模式识别是人类的一项基本智能,在日常生活中,人们经常在进行“模式识别”。人工智能领域的模式识别是通过计算机用数学技术方法来研究模式的自动处理和判读,是人工智能的核心内容。随着20世纪50年代人工智能的兴起,计算机已经开始代替并扩展人类的部分智能。大数据时代为模式识别带来了巨大的机遇,人工智能与人对弈的取胜意味着面向特定任务的模式识别已取得突破性进展。大数据的海量庞杂、异构多源、模态多样、也使得大数据时代的模式识别面临诸多挑战。

董晶说,在享受信息交换与资源共享带来的极大便利时,数字化信息能够大规模复制,并能轻易被篡改的特性同时也带来了许多负面影响。以前,人们常认为“耳听为虚,眼见为实”,然而在当前网络环境中,假图片或篡改图片正在严重误导着大众。“悬浮视察照”“藏羚羊假照片事件”等都曾掀起轩然大波;明星拼接图像更是层出不穷,引发很多绯闻。更严峻的是,假图片会对司法调查、保险鉴定、网络安全等这些严肃、敏感的地带造成严重冲击。

严峻的信息网络环境,迫切需要计算机拥有像孙悟空一样的“火眼金睛”,具备识破一切伪装信息的法力。董晶就是为计算机锻造“火眼金睛”的工匠之一。以数字图像取证、隐写分析及数字水印等视觉鉴别技术为应用背景,董晶着重研究人类视觉系统的感知特性、机理与计算方法。从人类视觉系统与计算机视觉系统的认知差异性出发,借鉴两类视觉系统之间的认知和计算差异性及关联性,她提出了一系列面向实际应用需求的视觉内容鉴别研究新方法。

“刚开始做信息隐藏时,我觉得十分有趣。”董晶说,“通俗地说,就是即使我用打印机打印一张白纸,也会附加上一些大家肉眼看不见的秘密信息。间谍、特务有时就是这样传递秘密信息的。”美国“911”事件中,据悉本·拉登便是通过在社区网络传播一些附带信息的照片,被一些别有用心的人提取出来,从而完成恐怖袭击任务的。

董晶研究的方法是模式识别的基础理论与方法,即模式识别的二分类法。这一研究与当时以生物特征识别、视频监控、大数据分析为主流的国家重点实验室的主流方向不太一致。然而董晶却对这一“小众”方向十分感兴趣,潜心研究,一做就是5年。取得博士学位后,董晶以优异的成绩留所工作,当仁不让地负责起了导师在这一领域的科研任务。

多年的坚持,让董晶在这个领域的研究已经有了一些成果。首先是基于成像约束条件的交互式图像真伪鉴别方法。该方法通过利用图像底层统计信息的不一致性表达及度量,反映图像高阶语义层的真实约束关系,由此鉴别图像表观内容的真伪。此外,她提出了一系列基于图像和视频底层相关特性的机器统计特征分析方法,简单并高效地辅助人类视觉系统进行视觉隐写分析。她还提出了一组基于边信息和量化抖动的鲁棒图像数字水印技术方案,较已有同类方法具有更高鲁棒性,有了这个方案,水印图像在多种水印攻击条件下,仍能被视觉系统感知与鉴别。

这些理论听起来高深,实际上在生活中的应用十分广泛。“比如把一张别人的脸PS成克林顿的脸,在自然场景拍摄图像的情况下,很难分辨出来。如果在成像原理上利用图像二次压缩之后信号改变留有痕迹的现象,通过模式分析和信号提取、放大、优化,可以准确地找到被修改的痕迹。”目前,董晶已经利用这项技术为新华社图片编辑部提供了一套解决方案。未来,这种应用还将出现在更多领域。

这些研究听起来简单有趣,在实际攻关中却不容易。董晶说:“微弱信号的识别工作有别于传统工作,隐秘信息没有统一的模型,很难被计算机识别。”因此,刚开始从事这项工作时,董晶的思路很少,而信息安全领域能够公开的文献又过于陈旧,真正有用的新技术都要很久以后才能公开。董晶的团队由于积累不多,成果一度出得很慢。遭遇科研瓶颈的董晶心里着急,甚至有些打退堂鼓。

就在这时,导师谭铁牛的一番话让董晶茅塞顿开:“这是个有价值、有影响力的科研方向,做科研不能只看眼前,不能什么火就做什么,一味跟风,而要重视长期的积累。也许你做的工作10年后才会被人认可,不能放弃。”

在导师的鼓励下,董晶重整旗鼓,再次出发。这一次她发现,越是沉下心来就越是能体会到科学研究的趣味。“科学研究万变不离其宗,找到解决问题的方法和思想最重要。”董晶说,现在自己做科研不是为了挣大钱,也不去考虑短期成果,而是真正想去做这件能让自己感到愉悦的事。“认准方向、下定决心,一步步去做,总会做出有意义的成果来。”

 

夯实根基 冷静审慎执守钻研

 

现在,董晶的课题组每年持续承担着国家信息隐藏领域的科研项目。从国家自然科学基金项目、科技支撑项目到重点研发计划,她在模式识别与图像取证领域的科研积累,在一个又一个课题的打磨下日益深厚。

此外,作为多个学会专委会的委员,董晶每年都要参与和组织多个领域相关的学术大会,并在大会上积极介绍自己研究方向上的新成果。她希望所做的一切能影响到这个领域的发展,为学科发展贡献自己的一份力量。

如今,董晶研究的copy-move检测、传感器噪声取证、像素重采样检测、反射不一致性检测、光照一致性检测等技术,在现实的网络空间安全中的应用都十分具有价值,她和导师谭铁牛也已申请了多项国际专利,但在现阶段,她却不急于进行技术转化,而是认为应该将主要精力放在基础研究上。

“有些技术其实很受企业的青睐。”董晶曾有一项技术让阿里巴巴、IBM公司十分感兴趣。这项技术可以检测图片中真实人脸的脉搏反射,捕捉微弱信号,进行模式识别,从而辨别出图中人物是真实拍摄还是电脑合成。尽管多家公司希望对此项技术进行深入研究或成果转化,但现阶段董晶只考虑做技术孵化。她说:“一项技术如果真做到产品阶段,大家更多考虑的是用户友好体验和细节的优化,对技术本身反而没有那么看重了。”她希望把这些细节留给有经验的工程团队去做,而自己的课题组继续集中精力在基础研究领域深耕。

其实,对董晶来说,研转产的机会有很多,她所在的自动化所就大力度鼓励科研人员离岗创业,甚至对一些创业项目提供3年停薪留职、平台融资等机会的优惠政策,然而这些并没有打动董晶。她说,自然图像取证,特别是隐写统一特征模型的研究,目前在整个学术界还没有完整的定论,关键的科学问题还没能解决好,即便应用也只能是皮毛。“我希望在关键问题的研究上多使点劲儿,如果大家都去搞应用,而中断了研究的步伐,这就可能成为永远的难题了。”

当前,人工智能已成为技术与资本风口,其转化速度也远超其他技术。很多人在这种背景下“下了海”,而董晶却多了一分清醒与冷静。“我们现在要警惕热过头。我很认同谭老师的看法,找风口不如找关口。国家究竟需要什么技术?什么技术才是对社会最有益的?我们在这些技术上和国外的差距到底在哪里? 这些都需要我们去冷静思考。”董晶认为,企业不应借人工智能炒概念、推风口。而作为这个领域的科技工作者,她的责任是站好岗、不跟风。这份踏实将让她一路前行,一路收获,在模式研究领域绽放自己的光彩。

 

张弛有度 广建平台延伸梦想

 

科研工作多而繁杂,董晶却十分懂得张弛之道。工作虽忙,她却从未因此放弃自己的爱好。阅读、旅游、瑜伽、摄影,只要能想出来的业余活动她都会抽空“涉猎”。虽然经常加班,但她并不是起早贪黑、埋头苦干的人。忙一段时间后,她会刻意让自己停下来,陪陪四岁半的孩子,陪陪父母、爱人,和朋友聚会。她说:“工作只是生活的一部分,如果你能热爱生活,就一定会热爱工作。”

董晶不仅懂得让自己在繁忙的工作之余放松下来,对于学生,她也鼓励他们张弛有度。“我指导学生基本上是‘放养’的。”说完,董晶大笑起来。当学生的课题进行不下去时,董晶总会让他们停下手中的课题,出去散散心,转换一下思路。她说:“读书不止是对知识的积累,攻读博士学位也不仅仅是发表几篇学术论文,更重要的是科学思维的启发和形成,我对学生能够形成正确的认知方法和学术思想看得尤为重要。”

现在,董晶除了在自己的研究方向上努力做出成果外,还想做好“人工智能与机器人教育联合实验室”的工作,将更多的科研成果做成科普课件和设备,为国家做好人工智能方向科研人才的培养工作。

现在,除了自动化所和联合实验室的工作外,董晶还担任着中国人工智能学会副秘书长、中国图像图形学学会副秘书长、IEEE等国际组织的志愿者任职以及Journal of Information Security and Application国际期刊副主编等学术兼职。她说,这些兼职都是为了拓宽视野,通过了解和参与不同的平台会促使自己为其设身处地地全面考虑问题,进而将这种“大局观”反馈到平时的科研工作中去。“对于年轻人,更要多给他们一些平台,没平台也要创建新平台,让他们能看到自己身边的方寸天地外还有更广阔的世界。”

“平台越深越广,舞台越做越大,事业越来越好。生命的长度不能延伸,但它的广度却是无限的。”这就是董晶的科研信条。

分享到:
杂志
本期封面

2024年3月

上一期 下一期