热搜词：

追一科技刷新CoQA记录 AI 单模型全面超过人类评测指标

时间：2019-09-12

软件大小：2.45GB

AI又一次挑战人类取得新突破这次是多轮对话阅读理解。

近日由斯坦福大学发起的对话式问答挑战赛 CoQA (Conversational Question Answering Challenge)中追一科技 AI Lab团队超越微软团队成为榜单第一刷新了之前微软等团队创造的CoQA纪录。值得注意的是团队提交的技术方案中单模型的各项指标表现首次全面超越人类。

阅读理解是目前语言AI最受关注进步最快的技术方向全球有两大顶级比赛最受瞩目,分别是注重一问一答的SQuAD和多轮对话问答的CoQA。相比SQuAD CoQA比赛重点挑战的是模型在对话过程中回答相互关联问题的能力而且对话问答数据集由来自不同领域一系列文章中的对话问题组成答案的形式非常自由这些改进点都极大地提高了挑战赛的难度。

在此之前包括微软科大讯飞搜狗等知名企业和院校都曾经登顶榜单其中微软在组合模型上一度成为最佳记录保持者引起业内瞩目。

追一科技团队在大规模预训练模型RoBERTa的基础上融入了对抗训练(Adversarial training)和知识蒸馏(Knowledge Distillation)的思想同时兼顾了CoQA数据集的自身特点实验结果表明上述方法显著地提升了系统表现。目前团队在2019年9月5日提交的RoBERTa + AT + KD系统在CoQA榜位列第一其中单模型(single model)的表现首次全面超越人工评测指标。

此次登顶CoQA 也是追一科技持续耕耘AI技术的成果之一。作为以技术创新为核心驱动力的AI公司追一科技一直专注在前沿AI语义交互与算法技术的攻坚在意图识别情感分析知识图谱阅读理解多轮对话等领域不断取得突破。并获得了2018 CMRC机器阅读理解比赛冠军 2019年CCF语言与智能技术竞赛的“知识驱动对话”冠军。

除了技术突破追一科技一直坚持研发与应用互相驱动规模化落地AI应用。追一科技的智能产品和解决方案已经在金融运营商政企泛互联网等众多领域落地服务300多家行业标杆客户。与此同时追一科技还致力于创新型技术的应用落地量产及标准化例如阅读理解多模态交互数字人等技术和产品已经在部分券商银行伙伴场景中应用实现业内突破。

随着NLP等AI技术的突破产业智能化时代的到来多行业场景化需求将对技术创新和产品化能力提出更多挑战。追一科技将继续专注创新能力攻坚技术前沿以技术创新赋能更多行业伙伴!

　　转载请注明出处。