发布时间:2017-12-09
本刊记者 杨 娇
博弈,本论棋之然也。博弈之道,贵乎谨严。法曰:“宁失一子,勿失一先。”诗云:“惴惴小心,如临于谷。”弈者,不争而自保者多胜,务杀而不顾者多败。因败而思者,其势进;战胜而骄者,其势退。求己弊不求人之弊者,益;攻其敌而不知敌之攻己者,损。
以弈度人,人生而静,其情难见;感物而动,然后可辨。
人是世界上最复杂的动物,人和其他动物的最大区别在于人会真正意义上的思考,人脑的运作机理远比世界上最精密的仪器还要复杂万倍。如何理解人的行为,则是比物理、化学、生物这些自然科学更为困难的问题。博弈论就是一门专门解释和预测人的行为的科学。它不同于心理学,心理学以人的行为动机为研究着眼点,博弈论则立足于人的行为本身,通过建立数学模型解析个体间的相互作用,在考虑别人可能行为的同时,研究自身的最优策略,为复杂场景下的决策提供合理的科学依据。
“传统博弈论一般更多关注个体的行为,并且假设人的行为完全理性,也就是说人们总是基于利益最大化原则进行决策。作为传统博弈论的进一步发展,我们的研究是从真实个体的行为出发,以有限理性为基础,研究宏观系统的变化规律。”北京师范大学数学科学学院副教授张博宇这样向记者解释道。张博宇从事博弈论研究多年,他的主要研究是将演化博弈方法和实验经济学方法相结合,分析不同激励机制对合作的促进作用以及社会网络结构对个体和群体行为的影响。
当初的选择 如今的扎根
有些选择一旦决定便为人生埋下了种子。张博宇与北京师范大学的缘分由来已久。自小学起,他就在北京师范大学参加奥林匹克数学学习,高考第一志愿进入北京师范大学后,于2006年在数学科学学院获学士学位,2009年在数学科学学院获应用数学硕士学位。硕士毕业后,他被国家公派至奥地利维也纳大学数学系进行博士学习。2012年获博士学位后,他便又回到北京师范大学数学科学学院工作,且在2015年被破格晋升为副教授,成为学院最年轻的副教授。同样,出于对人类行为研究的兴趣,张博宇接触博弈论后逐渐深入其中,进而将其确立为主要研究方向,决意一探究竟。在博弈论研究过程中,张博宇由聚而发,由点到面,将研究范围扩大化,在实验经济学、复杂网络和生物数学等多方向均有涉及,曾先后在PNAS, Games and Economic Behavior, Experimental Economics, Journal of Mathematical Economics等国际著名学术期刊上发表论文30余篇。
近年来,张博宇更是在博弈论和实验经济学研究中取得了多项有意义的成果,如激励机制对合作行为的影响,其他机制对合作行为的促进,带网络结构的演化动态,带有决策随机性的演化动态,从众行为的演化,公平行为的演化等。从理论和实验多角度论证了在促进合作方面,制度性惩罚优于制度性奖励;比较了个体间惩罚和制度性惩罚的效率和稳定性,从中理解政府机构如何在人类社会中被自发建立起来;研究讨论了决策方式为带随机性的最优反应均衡时的均衡选择问题,给出非对称协调博弈中不同决策误差函数下,均衡选择的一般性判据;分析了不同网络结构上不同学习模型对应的演化动态,考察了网络结构特征对行为演化的影响一系列的发现、发展让当初埋下的种子发芽生根并深深地扎入土壤。
枯燥、反复的数学推导难免会陷入行为思维僵化,对科研人员的思路创新产生阻碍。谈及遇到瓶颈时如何突破,张博宇回答的是理论和实验相结合,“理论研究遇到了困难就去做实验,正好用实验去验证理论方法是否正确”。博弈行为实验的被试对象大都是具有相似背景的在校大学生,实验地点也一般选取在学校的机房。实验通过计算机网络平台实现,每名被试者都需要使用计算机打开网页,登陆实验系统完成一系列模拟真实场景的简单游戏。在游戏中不同的选择被赋予不同的分值,被试者的选择直接影响其得分情况,且最后会根据实验中的得分获得相应的金钱报酬。分析实验数据,提取行为特征,建立理论模型,调整相关参数,再次实验验证,直至达到预期效果。张博宇坦言,这种实验和理论间的互动似乎已经成为研究常态。
一项工作从事久了很容易对思维模式产生影响,例如与数据打交道会对数字的敏感度高,文字工作者则表现在对语言表达的准确方面比较较真。有关人类行为的研究工作带给生活的变化,张博宇是这样答记者问的:“生活中会思考更多的人们行为和制度的设置的合理性,比如说上下班高峰期的出行选择、学校的绩效激励机制设置,我都会从博弈的角度想想是否合理。”科研似乎更像一种习惯,融入了他的生活。
理论与实际的结合
科学研究的终极目的是解决实际问题,理解人们行为的最终目的是提出方案或建议使人类社会变得更加美好。能否成功预测真实人群的行为是张博宇对研究工作最功用、最具指导意义的评判标准。只有具备了准确的预测能力,才能够将理论和实验研究中得到的成果在现实中进行应用和推广。
张博宇及其所在团队主要采用实际数据和理论方法相结合的方式,来完成研究工作。研究路线大致分为三步:首先,通过实验和实证方法得到真实个体的行为数据,根据这些数据建立起个体的决策模型;然后,基于个体决策模型推导出群体的宏观演化规律,找到影响宏观系统演化的关键参数;最后,通过调整这些参数来引导人们优化自身行为,进而实现社会收益最大化。以如何合理设立奖惩机制促进合作为例,张博宇给出了细致的实验布局:最初是通过实验检验人们不同情境下对不同奖励或惩罚的反应,识别出几类典型的行为特征;进而建立起群体面对不同激励时的宏观演化模型,提出理论上效果最好的激励参数;最终经过实验和实证检验修正后的激励机制,确定其在实际中能否更加有效的促进合作。
要使研究更有意义,更贴近现实,就需要在模型中尽可能多的考虑进真实因素。例如,以往对群体行为的研究一般假设参与人均匀混合,不同个体间进行博弈的机会均等。但是在真实社群中,不同人之间的相互作用机会并非完全均等,并且一些人的社会关系会明显多于其他人。一般意义下这种特征可以通过复杂网络方法表示。张博宇在国家自然科学基金项目中,以具有网络结构的演化博弈动力学为研究课题,分析了社会关系网络、经济关系网络、信息传播网络等如何对个体和群体的行为演化产生影响,构建了包含不同类型网络结构的演化博弈动态模型,深入分析了网络结构特征对宏微观系统的影响。这些结果对博弈理论的完善和发展做出了极具意义的贡献,同时也为解释网络时代的经济现象提供了新的理论视角和分析方法。
此外,张博宇还在多项实际应用类项目中担任负责人的角色。例如在承接中体彩科技发展有限公司的体育彩票分析项目中,对不同类型的彩票游戏中海量的购买信息进行了数据挖掘,提取出了人们的投注行为特征,然后以此为基础模拟了不同彩票游戏在不同销量情况下的期望收益,并评估了可能存在的风险。而在另一项卫生行业专项基金中,根据近几十年来的生境和种群监控数据,张博宇参与建立了多个疫源地的动物鼠疫预测模型,提出了关键预警指标以及风险分级和风险控制方案。
无论是博弈论的基础研究还是在其他行业实际应用中,张博宇都能找准自己的位置。十年磨一剑,求学至今,他没有过多的感慨,对目前的工作状态尚还满意,但求今后稳扎稳打地走好每一步。科研的博弈,人生的博弈,稳中求胜。
- 资讯
-
-
《科学中国人》杂志社记者证2024年换证人员公示
根据《国家新闻出版署关于开展2024年第七版新闻记者证全国统一换发...
-
“一猪两用-食用猪和医用猪”专场报道
2024年7月,正值夏季火热时节,各界专家齐聚科技创新之城——深圳,参加...
-
“2024前沿科学创新大会”在深圳召开
科技改变世界,创新引领未来! 2024年7月12—14日,“2024前沿科学创新...
-
当年累得坐马桶就睡着的科学家,成为今年国家最高科学技术奖得主
里程碑 笔者第一次见到薛其坤院士是在2019年年初,他领导团队完成的“量...
-
45岁用一篇论文解百年难题,85岁他站上国家最高科技领奖台
从跋山涉水扛着机器测量,到航空遥感再到卫星遥感,测绘遥感学科领域随...
-
这些科学家和标志性成果获得国家科技奖励!了解奖项分布与获奖特点→
2023年度国家科学技术奖今天揭晓。一大批贡献卓越的科学家和标志性成果...
-
《科学中国人》杂志社记者证2024年换证人员公示