来源: 发布时间:2021-08-12
文 梅 宏
大数据产业发展回顾
信息化就是信息技术广泛应用及深入社会生活各个方面的历程,真正的信息化浪潮是从个人计算机进入市场、进入家庭开始的。以单机应用为主要特征,其主要目标是实现办公数字化。而随着互联网的大规模商用,以联网应用为主要特征的网络化应用逐渐出现,这一过程就是社会数字化。如今,互联网正在进入以数据深度挖掘和融合应用为主要特征的时期。伴随互联网出现的新经济模式也开启了数字经济时代。从农业经济到工业经济再到数字经济,如今的数据已经成为重要的生产要素。
2017年4月IDC发布的《数据时代2025》预计,2020年全球数据量将超过50ZB左右,2025年全球数据量将达到175ZB,其中实时数据将占比30%。而在2021年3月,IDC预计全球大数据市场支出规模将在2024年达到约2983亿美元,预测5年期内(2020—2024)实现约10.4%的复合增长率(CAGR)。大数据服务支出将在全球层面保持其主导地位,占市场总量一半以上。
聚焦我国,中国大数据支出整体呈稳步增长态势,市场总量有望在2024年超过200亿美元,与2019年相比增幅达145%。同时,中国大数据市场5年复合增长率(CAGR)约为19.7%,增速领跑全球。
2012年:7月,美国风险投资人Matt Turck开始绘制大数据产业图谱V1.0,2012年10月更新并发布大数据产业图谱V2.0,大数据基础设施作为研发重点,基础设施相关业务和企业发展较快,生态系统逐渐形成并快速演化。
2014年:大数据产业聚焦数据研发,大数据分析成为热点,大批公司成立并快速发展,风险投资大量涌入,生态系统仍处初级阶段。
2016年:大数据应用成为发展重点,面向行业和领域的应用型企业发展迅猛,生态系统向更成熟发展。
2017年:数据治理首次纳入基础设施,数据治理与数据安全成为重点实施领域,生态系统发展全速推进。
2018年:数据治理是大数据生态系统中快速增长的部分之一;2018年是“数字化转型”阶段,数据驱动的业务真正落地;大数据与AI难以区分,呈“体”和“用”的关系。
2019年:数据和AI生态系统仍然是最令人兴奋的技术领域之一,基础设施、云计算、人工智能、开源以及人类经济和生活的整体数字化也在快速发展,并相互交织,这一切都推动“万物数据化”成为一种快速演进的“大势”。
2020年:云计算和数据技术(数据基础架构、机器学习/人工智能、数据驱动的应用程序等)成为数字化转型的核心技术,数据生态系统的韧性与活力进一步显现。
针对这8年间大数据领域的变化,可以将其分为5个阶段:基础技术和基础设施、分析方法与系统、行业和领域应用、大数据治理、数据生态体系。
数据生产要素化的认识和思考
数据作为生产要素的特征、价值和意义可以从两个角度分析:一是本体论。数据本身蕴含很多信息、知识、规律甚至智慧,数据是有价值的。二是方法论。从方法论角度来看,怎么用数据理解行业成为了重点。
通过对传统生产要素数字化并数据化来实现赋值、赋能,数据从某种意义上已经成为传统生产要素在数据空间中的数字孪生。数据要素的主要特征包括:1.非排他性(或非独占性),即可复制、可共享、可交换、可多方同时使用,共享增值;2.非竞争性,即开发成本高,在动态使用中发挥价值,边际成本递减;3.非稀缺性,即万物数据化,快速海量积累,总量趋近无限,具有自我繁衍性;4.非耗竭性,即可重复使用、可组合、可再生,在合理运维情况下可永远使用。生产要素的类别随着技术发展、社会进步在不断扩展,数据要素作为一种新型生产要素,能够数据化所有其他要素,并促进其他要素提升生产效率。“万物数字化、万物互联”的时代,由数字化万物所构建的数据空间,为人类认识世界和改造世界提供了颠覆性手段。将劳动、土地、资本、技术、管理、知识等各类要素数字化并数据化,发挥数据对提高生产效率的乘数倍增作用。
当前,数据要素化面临4个挑战:一是数据的资产地位尚未确立,二是数据确权难题尚待破解,三是数据共享流通障碍重重,四是数据安全和隐私保护体系尚不健全。
构建数据治理体系
实施国家大数据战略,建设数字中国,发展数字经济是新时代的必然选择,其途径是加快推进各行各业的数字化转型,其关键是加快培育数据要素市场。无疑,这是一项系统工程,需要统筹、系统化推进。我以为,数据治理体系的构建需要先行!
构建数据治理体系要坚守4个基本原则:一是坚持战略思维,构建数据治理体系;二是坚持辩证思维,深刻认识数字经济时代的一般规律;三是坚持创新思维,探索引入新型数据治理理念;四是坚持底线思维,切实保障国家安全和人民权益。
要统筹协调好国家、行业及组织3个层次之间关系。国家层面,要加紧制订数据治理的“上位法”,指导和监管行业及组织的数据治理;行业层面,通过行业自治的模式,在自愿原则上形成行业协会或联盟等,作为政府和企业间的桥梁,在国家法规和政策的指导下,制订并执行行规行约和各类标准,监督企业的行为,并向政府传达企业的共同需求;组织层面,在国家和行业框架下,针对自身特点,确定治理目标,优化对大数据资源的管理,最大化从大数据获得的收益,并为行业和国家大数据发展贡献成功应用实践。
要构建数据治理体系,须切实做好4方面工作。
第一,强化顶层设计,理顺权责边界。推动数据相关立法,明确数据确权、隐私保护、交易流通、数据跨境等管理要求;构建政府主导、多方参与的数据治理体系,厘清政府、行业、组织等在数据要素市场中的权责边界。
第二,建立流通机制,促进市场配置。建立完善数据登记、分类分级、质量保障等管理制度和标准规范,确保数据资源有效供给;参照自然资源特许经营模式,建立数据开发利用、加工运营、交易服务等流通机制,推进数据产品和服务的有序流动。
第三,开展试点示范,推动应用落地。在有条件的地区试点先行,以数据要素市场化配置改革为突破口,探索形成数据评级、数据交易与监管机制;梳理总结并推广试点工作经验,形成数据运营加工的新业态,以市场化方式推进应用落地。
第四,加强理论研究,提升技术能力。鼓励更多的学科介入,积极开展数据治理、数据流通、数据运营、数据加工等基础理论研究,充实理论储备;支持数据确权、数据互操作、共享流通、数据安全、隐私保护等相关技术研发,提供有效技术保障和方案。
数据治理体系需要持续完善制度法规、标准规范、应用实践和支撑技术4个方面的治理工具和手段。特别是需要鼓励应用实践,允许认定的地方、机构在一定的范围内先行先试,获取经验和教训,以应用实践为牵引,推进制度法规、标准规范和支撑技术的发展完善。
(文本为梅宏院士在第四届数字中国建设峰会大数据分论坛上的主旨演讲)
专家简介
梅宏,1963年5月出生于贵州省遵义市。计算机软件专家,中国科学院院士,发展中国家科学院院士,欧洲科学院外籍院士。曾任北京理工大学常务副校长、上海交通大学副校长。现任高可信软件技术教育部重点实验室(北京大学)主任,中国人民解放军军事科学院副院长。主要从事软件工程和系统软件领域的研究,在构件化软件中间件、开发方法学和工具环境等方面取得了系列成果。两次担任国家原“973”计划项目首席科学家,曾任国家原“863”计划专家组成员、国家原“863”计划“十二五”信息技术领域先进计算技术主题专家组组长、国家“核高基”科技重大专项专家组成员等。担任多个国内外学术期刊编委,数十次担任重要国际学术会议程序委员会主席或委员。曾获国家自然科学奖二等奖,国家技术发明奖一等奖、二等奖,国家科技进步奖二等奖;高等学校科学研究优秀成果奖自然科学奖一等奖,高等学校科学研究优秀成果奖技术发明奖一等奖等科技成果奖励。