科学中国人|科学中国人官方网站|科学中国人杂志社-杂志

让机器能理解会思考，让认知智能顶天立地

来源：发布时间：2024-12-10

——认知智能全国重点实验室

　　随着人工智能第三次浪潮的到来，全球正迎来一场全新的产业变革。我国在深度学习和知识图谱等领域已取得显著进展，但与人类认知能力相比仍有差距。目前，深度语义表示、知识图谱建模和类脑智能等研究领域展现出推动认知智能实现重大突破的潜力。接下来的十年将是认知智能发展的关键时期。

　　肩负使命，砥砺前行，认知智能全国重点实验室（以下简称“实验室”）在需求的驱动之下组建。实验室由中国科学技术大学和科大讯飞共建，于2022年5月正式获批重组，成为首批20家标杆全国重点实验室之一。

　　实验室以“让机器能理解会思考，让认知智能顶天立地”为使命，开展认知智能共性基础问题研究和前沿技术攻关，并在教育、医疗、交互、翻译等领域实现国际领先和业界引领的智能应用系统，解决我国优质民生资源普惠供给、中国智造升级和“一带一路”语言互通等国家需求，多项认知智能系统取得规模化落地应用。

瞄准需求帷幄布局

　　实验室瞄准国际认知智能技术的理论和技术发展前沿，面向国家重大战略需求和人工智能产业发展，以人机交互、智慧教育、智慧医疗、智慧司法等领域对认知智能技术的广泛和共性需求为牵引，重点开展语义计算、知识建模等认知智能基础理论及技术研究，形成了5个研究方向布局。

　　（一）认知基础共性技术

　　实验室面向科技前沿，开展以大模型为核心的认知智能研究框架和产学研协同模式研究，围绕认知智能基础共性技术中的高质量数据处理与知识表示、知识构建与推理、持续学习与自主进化，研究高质量数据处理与生成、跨模态知识统一表达范式、跨模态语义关联与融合、多模态知识抽取与对齐、可信知识推理框架、思维树提示学习方法、增量知识学习、大模型能力认知诊断、意图对齐反馈的强化学习进化机制等关键技术，并开展神经网络大模型智能涌现原理探究及大模型与脑科学的交叉前瞻探索。

　　（二）行业认知

　　实验室面向“幸福中国”实现基于人工智能的教育、医疗优质资源普惠供给的需求，研究认知智能应用关键技术，具体包括：在教育领域研究口头语言运用能力评测、书面语言运用能力评阅、理科解答题批改、学情诊断、学习路径规划和个性化推荐；在医疗领域研究医学文本内涵解析与知识构建、时序推理智能诊断、多模态问诊、病历书写内涵质控；在司法领域研究案件信息自动抽取、案件自动量刑预判、司法文书自动生成、司法文书自动质检与纠正、基于案情分析的法条推荐、司法证据链分析审查等关键技术。

　　（三）人机交互

　　实验室面向“中国智造”升级手机/汽车/家电/机器人等人机智能交互的需求，深入布局拟人化人机交互技术，解决人机交互领域的核心科学问题，主要包括如何结合认知智能实现触摸、语音、语言、手势、人脸、视频等跨模态交互方式的融合，以及如何准确认知理解人机交互过程的广泛信息需求，最终完成自然有效的交互系统响应，提升整体人机交互体验。重点研究人机交互对话管理、多模态交互感知、全双工交互、主动交互、多轮对话、智能知识问答、情感交互、多维度表达等关键技术。

　　（四）多语种语言

　　实验室面向“一带一路”构建跨语言沟通无障碍的经济文化交流环境的需求，研究多语种数据和专家资源稀缺条件下的语音识别、语音合成、图文识别、机器翻译建模方法，以及多语种语音翻译/同传翻译/图片翻译中多任务协同优化技术，建立以中文为核心的多语种自动翻译系统和平台，支持“一带一路”共建65个国家53种官方语言及其他周边语种，与汉语之间的文本、语音和图像等多种模态输入的双向互译，并实现中文和20个语种的高可用语音同传，为不同国家和地区之间的跨语言沟通交流和信息传播提供核心支撑。

　　（五）科技文献服务（拟设立）

　　实验室将面向成果调研、论文研读、科研写作等计算机科学场景下助力科研加速的需求，构建大规模科技文献知识库，持续积累优化科技文献论文数据；持续优化基于语义检索的多阶段论文阅读理解、大模型检索增强算法、基于科技文献向量知识库的知识问答和结论解读、多语种文献智能分析等技术；构建端到端的检索增强模型优化流程，实现人类偏好反馈和模型选择的迭代优化；通过科技文献服务智能化，服务更多科技工作者，助力我国科技发展创新。

顶天立地卓越创新

　　自成立以来，实验室始终秉承“顶天立地”的理念和追求，锐意进取、埋首耕耘，取得了一系列达到国际领先甚至唯一的原创性科研成果，为领域实现我国源头技术自主可控作出了卓越贡献。伴随着一个又一个成果的涌现，实验室积累的创新实力已经显露。

　　2022年3月，代表前沿国际技术和水平的第十六届国际语义评测大赛举行。在这项认知智能领域重要的国际赛事中，实验室率队杀出重围，连夺3个主要项目冠军。而在此之前不久，实验室还以76.06%的准确率，刷新同样是认知智能领域内的常识推理挑战赛CommonsenseQA 2.0的世界纪录，比第二名领先了近3个百分点。

　　实验室突破认知基础共性技术，达到整体国际一流、部分领域国际领先的水平，自批准建设至2023年年底共获得16项国际认知智能领域权威评测冠军和中国计算机学会自然科学奖一等奖等奖励和荣誉。其中，2022年实验室3次夺得常识推理赛事冠军，除了在常识推理挑战赛CommonsenseQA 2.0上崭露头角之外，还先后在科学常识推理挑战赛OpenBookQA和常识推理挑战赛QASC上夺冠，并两次超越人类平均水平，实现认知智能技术的重大突破；2023年，实验室提出了用于知识构建和推理的D-Reasoner模型，并在离散推理阅读理解任务DROP中夺冠，所有指标均刷新纪录。此外，实验室团队提出用于持续学习的VL-Reasoner模型，在多模态问答比赛A-OKVQA中夺冠，大幅提升了视觉问答（Visual Question Answering，简称VQA）效果；推出中文“羊驼”系列大模型开源项目，广获业界好评，多次荣登GitHub（一个面向开源及私有软件项目的托管平台）全球趋势分析项目和个人总榜榜单，并成功荣登总榜首位。

　　面向通用人工智能国际科技前沿，实验室于2022年12月15日自主部署“认知智能大模型技术及应用”专项攻关，开展数据获取、数据清洗、算力建设、国产化移植、内容安全、算法攻关和应用技术等各方面工作，突破了软硬一体化自主可控训练、跨领域异构知识统一表征、训推一体协同优化等技术，取得了积极进展，于2023年5月6日首次发布星火认知大模型并持续迭代升级。2024年6月27日发布的讯飞星火大模型V4.0已实现全面对标GPT-4 Turbo。

　　实验室在既定研究任务基础上，面向教育、医疗、办公、汽车、工业、金融等领域开展基于认知大模型的应用创新，解决社会刚需。在教育领域，大模型中英作文批改准确率已经超过一般老师的水平；口语教学已支持CET、雅思、托福等多类口语学习和模考。在医疗领域，研制了超越GPT-4的医疗大模型，研发具备多轮、主动交互能力的讯飞晓医App，覆盖1600种常见疾病、2800种常见药品、6000种常见检查检验，满足用户看病前、用药时、检查后的核心场景健康需求。在科研领域，实验室与中国科学院文献情报中心合作研发了科技文献大模型和星火科研助手，支持成果调研、论文研读及学术写作等研究工作，目前已覆盖超5万科研工作者，成果调研等效率可提高近10倍。

同心聚力开启未来

　　实验室在人才培养和学术交流方面同样取得了显著成绩。实验室汇聚了一批顶尖的科研人才，包括多位院士和行业内的知名专家，共同推动认知智能领域的研究。在学术交流方面，实验室还积极举办和参与各类学术会议，如第一届认知智能与大数据技术研讨会（CIBD 2024）等，这些活动不仅加强了实验室的学术影响力，也为人才培养提供了丰富的实践机会和交流平台。这些努力，为实验室科研人员创新思维的培养提供了良好的环境，也为实验室的未来发展奠定了坚实的基础。

　　展望未来，实验室将立足使命任务，向认知智能发展领域面临的诸多瓶颈问题发起挑战，通过人工智能技术的突破和软硬一体化的能力的提高，帮助人类更好地应对未来。

分享到：

下一篇持续加强科技人才队伍建设

杂志

本期封面

2025年5月

上一期下一期

战略合作:

友情链接: