欢迎您登录科学中国人官方网站!!
新浪微博|网站地图|联系我们
孔新兵:大数据时代:向高频出发

来源:  发布时间:2018-12-05

  □ 武光磊
  
 

 
  信息存储技术和分析技术正以惊人的速度发展,技术的高速进步使实时数据也多以“加速度”的方式呈现在人们眼前。如何充分挖掘和利用这些“转瞬即逝”的实时数据不仅是数据分析家应该正视的问题,也已成为当今“大数据”时代的研究热点。因此,急需一种可以结合行业背景的分析方法,“因地制宜”地为提炼海量数据中有用信息而提供具体理论工具。高频数据统计分析正好可以实现这个目的。
  当前,高频数据广泛应用于金融、环境等众多领域里,为金融风险管理、环境监测等多方面提供了指导和预测。南京审计大学教授孔新兵在这一领域里已研究多年,积累了丰富的经验,他始终认为做科研就要做最前沿的,解决实际问题,还要使成果获得广泛应用,高频数据正是这样吸引着他不断前进的。
  

痴迷高频数据


  在金融领域里,每秒钟都会进行大量交易,利用高频数据对其观察,记录频率可达到秒级。而在环境领域里,想要对设备中的化学含量进行实时监测,利用高频数据,观察频率同样可达到秒级。超快的速度加上独具一格的高维度、模型跳跃结构复杂等特性,高频数据以其独有的魅力吸引着孔新兵的研究目光。
  但随着研究的加深,孔新兵发现数据维数和记录频率的爆发式增长,暴露了大面板高频数据在理论与实际应用中存在的许多问题。近年来他对存在的问题展开系统研究,并取得了多项重要成果。
  其中,他首次建立了高维近因子模型因子收益序列和残差序列的经验过程理论。他还巧妙地利用高频数据的高峰厚尾这一特点,成功给出识别纯跳伊藤半鞅过程模型的方法,在一定技术假设下成功解决了检验功效较低的缺点,成果发表在统计学顶级杂志Annals of Statistics上。
  紧接着,孔新兵很快发现尽管检验效率有所提高,但检验统计量在原假设下的收敛速度还需改进,为此他利用经验特征函数法成功构造出一种新的检验统计量,使在原价设下的速度由原来的n1/4增加到n1/2,达到了最优的收敛速度。
  此外,孔新兵在国际上首次开展了针对具有时变因子荷载结构的连续时间因子模型的研究,他在其中首次引入了适用于大面板高频数据的局部主成分分析方法,成功得到具有时变因子荷载结构的连续时间因子模型的因子个数的相合估计。同时还进一步证明了在估计因子个数时与不变因子荷载矩阵这两种情形下,无论是使用全局主成分分析方法还是经过整合的局部主成分方法,都具有同样的收敛速度。
  与此同时,他在局部主成分分析整合法的基础上,分别给出了单个资产的系统积分波动率和个体积分波动率的相合估计及其收敛速度,然后在时变因子荷载矩阵的框架下给出了个体积分波动率矩阵及其逆矩阵的相合估计和谱范数意义下的收敛速度。
  

难忘初心不断打磨


  如今,在高维高频数据统计分析方向上,孔新兵已成为国内重要的主要研究力量之一。科研之余,他还时刻不忘加强学术交流与合作,并将知识传递给更多的人。
  孔新兵已受邀参加第十二届中国数学会年会、第十届中国概率统计年会、IMS-China统计会议等多个学术会议,同时多次开展国际学术交流和访问,与悉尼大学、新加坡国立大学等高校建立了广泛的联系与合作。
  在教学上,孔新兵一直主张以学生为主体,激发学生学习兴趣,并培养学生善于表达自己见解的习惯。同时,他一方面注重夯实学生的理论基础,另一方面也时刻兼顾培养学生的创新和动手能力。
  生有涯而学无涯。过去的荣誉是认可、是鼓励,也是动力。面向未来,孔新兵会和团队共同携手向前,积极揭开高频数据中的一个个难题。

分享到:
杂志
本期封面

2024年3月

上一期 下一期