追一科技刷新CoQA记录 AI 单模型全面超过人类评测指标
-
-
软件大小:2.45GB
- 立即下载
AI又一次挑战人类取得新突破 这次是多轮对话阅读理解。
近日 由斯坦福大学发起的对话式问答挑战赛 CoQA (Conversational Question Answering Challenge)中 追一科技 AI Lab团队超越微软团队成为榜单第一 刷新了之前微软等团队创造的CoQA纪录。值得注意的是 团队提交的技术方案中 单模型的各项指标表现首次全面超越人类。
阅读理解是目前语言AI最受关注 进步最快的技术方向 全球有两大顶级比赛最受瞩目,分别是注重一问一答的SQuAD和多轮对话问答的CoQA。相比SQuAD CoQA比赛重点挑战的是模型在对话过程中回答相互关联问题的能力 而且对话问答数据集由来自不同领域一系列文章中的对话问题组成 答案的形式非常自由 这些改进点都极大地提高了挑战赛的难度。
在此之前 包括微软 科大讯飞 搜狗等知名企业和院校 都曾经登顶榜单 其中微软在组合模型上 一度成为最佳记录保持者 引起业内瞩目。
追一科技团队在大规模预训练模型RoBERTa的基础上 融入了对抗训练(Adversarial training)和知识蒸馏(Knowledge Distillation)的思想 同时兼顾了CoQA数据集的自身特点 实验结果表明 上述方法显著地提升了系统表现。目前 团队在2019年9月5日提交的RoBERTa + AT + KD系统 在CoQA榜位列第一 其中单模型(single model)的表现首次全面超越人工评测指标。
此次登顶CoQA 也是追一科技持续耕耘AI技术的成果之一。作为以技术创新为核心驱动力的AI公司 追一科技一直专注在前沿AI语义交互与算法技术的攻坚 在意图识别 情感分析 知识图谱 阅读理解 多轮对话等领域不断取得突破。并获得了2018 CMRC机器阅读理解比赛冠军 2019年CCF语言与智能技术竞赛的“知识驱动对话”冠军。
除了技术突破 追一科技一直坚持研发与应用互相驱动 规模化落地AI应用。追一科技的智能产品和解决方案 已经在金融 运营商 政企 泛互联网等众多领域落地 服务300多家行业标杆客户。与此同时 追一科技还致力于创新型技术的应用落地 量产及标准化 例如 阅读理解 多模态交互数字人等技术和产品 已经在部分券商 银行伙伴场景中应用 实现业内突破。
随着NLP等AI技术的突破 产业智能化时代的到来 多行业场景化需求将对技术创新和产品化能力提出更多挑战。追一科技将继续专注创新能力 攻坚技术前沿 以技术创新赋能更多行业伙伴!
转载请注明出处。