4月12日,由科大讯飞承建的我国首个认知智能国家重点实验室,以76.06%的成绩荣登常识推理挑战赛CommonsenseQA 2.0榜首。作为中国最大AI科技公司之一的科大讯飞首次参赛,即创新性地提出ACROSS模型,以全新深度学习算法绝对优势,刷新了机器常识推理水平的世界纪录。

打开网易新闻 查看更多图片

常识推理(Commonsense Reasoning)是 NLP 最重要的前进方向之一,目的是帮助计算机学习常识知识,并利用所掌握的知识进行深层次的理解及推理。

那么机器学会常识推理有多难?

当前典型的阅读理解模型所关注的主要是事实类问题,这类型的问题答案往往能直接在原文中找到,但是如何让机器学会常识及背景知识并进行准确推理,是一个巨大的挑战。

CommonsenseQA 2.0是一个二元分类数据集,主要分为训练/开发/测试集,需要判断常识性陈述是对还是错。相比较1.0的“选择题”,2.0“判断题”挑战难度更高,仅给定一个主题实体或概念、一个常识类关系,让人类以自然语言的方式去构造机器较难掌握的常识知识。

科大讯飞承建的认知智能国家重点实验室团队,创新提出的面向常识知识推理的ACROSS(Automatic Commonsense Reasoning on Semantic Spaces)模型,实现了统一语义空间下外部知识的有效融合,显著改进了超大规模预训练模型所存在的问题,在CommonsenseQA 2.0任务上取得76%的准确率。

目前以科大讯飞为代表的中国人工智能力量在常识推理领域中已有很大的进步,但是仍远低于人类94.1%的水平,可见在常识性推理方向仍有很大挑战和进步空间。

该领域的进展及技术突破对人工智能发展具有重要的意义,科大讯飞的各项业务也在人工智能技术的带动下持续发展。

此前,在科大讯飞发布的经营情况公告中显示,科大讯飞已先后斩获了人工智能领域多项重量级荣誉。据统计,在过去的一年时间里,科大讯飞在人工智能关键核心技术领域的国际重要赛事中一共摘取11项冠军。

取得的成果进一步强化了科大讯飞在教育、消费者、医疗、汽车、智慧城市等领域的技术壁垒和领先优势,为长期发展持续构建了系统性创新的底层能力,并持续筑就科大讯飞竞争优势明显的行业科技品牌号召力,也为科大讯飞实现了2021年度营收超过183亿元, 2022年一季度取得营收35.06亿元的成绩。

我国在常识推理领域的技术攻坚还在继续。科大讯飞拥有专业的人工智能核心技术,未来也将持续助力“让机器能听会说、能理解会思考”在教育、医疗、养老等国计民生场景中的落地。