来源: 发布时间:2017-02-14
本刊记者 刘 江
人类正在进入后信息时代,计算机越来越广泛地进入到几乎所有的科技和生活领域。现代计算机具有强大的功能和运行速度,但与人脑相比,其智能化程度仍有待提高。如何让计算机具有类人脑的学习与分析能力,拥有“视觉”“听觉”,并可通过“思考”与人类沟通交流,是当今世界计算机视觉研究领域各国科学家不断追求和探索的目标。
计算机视觉是人工智能领域的核心之一,其研究的终极目标是让机器具有人一样的视觉功能。西安交通大学电子与信息工程学院杨国安教授在计算机视觉领域沉心研究多年,为计算机视觉的发展提供了丰富的理论基础。
“西安交通大学郑南宁院士是图像处理、计算机视觉和模式识别领域的国际知名专家,是他2001年把我从日本引进回来的。”这是杨国安选择计算机视觉和图像处理领域的契机。在该领域,杨国安主要研究新型的小波变换、多尺度几何分析和压缩感知理论,对这些最前沿的理论进一步地改进,以提高图像分析与理解的能力、计算机视觉模型的精度、大数据的模式分类的效率以及互联网图像检索的正确识别率。
留学回国后,杨国安在郑南宁院士团队参与完成了多项国家项目,包括国家自然科学基金创新研究群体项目“智能化视觉信息处理理论与实现技术”,国家自然科学基金重点项目“高效可伸缩视频编解码基础理论与方法研究”,国家重点基础研究发展计划项目“视觉信息环境感知与识别关键技术”,国家科技支撑计划项目“数字媒体内容互通共用关键技术”,国家高技术研究发展计划项目“基于离散小波变换的JPEG2000图像处理及场景数据实时传输”等。其中,在国家科技支撑计划项目中,杨国安取得国家发明专利“一种分布式多格式数字视频转码结构设计方法”的正式授权。该项专利开发出了一种分布式多格式数字视频转码结构设计新方法:对源视频文件解复用后将视频进行快速无缝分割,通过动态调度程序,将视频片段以及音频文件发送到各个转码计算机上进行快速多格式转码,在输入某一种格式的视频后只需解码一次,便能输出多种格式的码流,并且能对输出码流进行很好的码率控制,最后收集转码后的视频片段进行无缝拼接并与转码后的音频文件复用。该项专利不仅改善了像素域级联转码器的转码效率,也增强了视频转码后的质量,并在我国相关电视厂家得到实际应用,取得了良好的社会和经济效益。
目前,杨国安正在主持国家自然科学基金项目“基于生物视觉稀疏编码特性和显著性特征的多尺度几何分析纹理模型研究”。他介绍说,今后的研究重点将是进一步研究基于多尺度几何分析和脉冲耦合神经网络的生物视觉模型,并将其应用到大数据的模式识别以及互联网图像检索上。
学术方面,杨国安勤心聚力,砥砺前行。他长期兼任IEEE Transactions on Signal Processing和Neural Networks等世界顶级期刊的通信评审专家,并在IEEE、Elsevier和Springer等知名期刊和国际会议上发表SCI和EI收录论文30余篇,其中SCI收录8篇,EI收录21篇,取得国家专利2项,出版“十一五”至“十三五”规划教材各1部,为硕士和博士研究生开设课程,培养硕士研究生和博士研究生30余名,2016年2月又培养出交通大学历史上第一位日本博士留学生。
在科研的世界里,只有脚踏实地,持续奋斗与攀登,才可能收获点点星光。在20余年的研究工作中,杨国安亦是如此勉励自己,不断创新,突破传统。相信在未来,他一定能收获一片属于他的星空!