阿里AI模型摘下世界大赛桂冠阅读理解能力测试刷新世界纪录 - 中企营销网

中企营销网品牌资讯展会实战终端广告时尚汽车企业电商视频搜索网络管理文化创业招商职场访谈智能 AI 物联网大数据数字化

阿里AI模型摘下世界大赛桂冠阅读理解能力测试刷新世界纪录

大数据发表时间:2019/7/3 15:28:45 来源:iwangshang

大数据发表时间:2019/7/3 15:28:45 来源:iwangshang

近日，在斯坦福等院校和机构发起的“多轮对话型阅读理解评测”（QuAC）上，阿里巴巴人工智能模型“TransBERT”击败全球对手，不仅拿下了评测的桂冠，更刷新了该项测试的世界纪录。这也意味着，以阿里巴巴AI为代表机器阅读理解能力，又往前迈进了一步。

QuAC（多轮对话型阅读理解评测）由华盛顿大学、斯坦福大学和艾伦人工智能研究院等研究机构联合发起，与SQuAD（文本理解挑战赛）、CoQA（对话型机器阅读理解挑战赛）并称世界级阅读理解评测竞赛，吸引了全世界顶级科学家和技术团队参与。本次竞赛的难点在于，要求参赛的AI模型阅读篇幅更长的多轮对话，题目中还有“指代”和“省略”，甚至还存在原文中没有对应答案的模糊问题，这就要求AI模型要有如同人类般“联系上下文”的能力，高度考验联想和推测能力。

阿里巴巴智能服务事业部算法专家计峰介绍说，此次测试中出现了多次以“他”、“他们”进行的第三人称指代，需要机器进行上下文的主动联想，并作出综合判断；还有无法在原文中找到对应答案的开放式问题，测试的是AI模型在基于文本的阅读理解之外，调用日常储备数据库进行推想的能力，几乎无限接近人类思考模式。

主办方也认为，多轮对话型阅读理解是目前人工智能对话领域复杂性最高、最考验自然语言理解技术的，已经接近人类日常交流的真实场景。

评测案例接近人类日常交流的真实场景，高度考验AI模型的联想和推测能力

凭借自主研发的“TransBERT”AI模型，阿里巴巴智能服务事业部、计算平台事业部联合浙江大学人工智能研究所，打败国内外竞争者，以三个指标总分144.1拔得头筹，刷新了此测试的最高纪录，其中两项指标大幅超过第二名。

“TransBERT”AI模型以三个指标总分144.1拔得头筹，两项指标大幅超过第二名

AI技术面对多轮次对话，以及“指代”、“省略”、“模糊语义问题”等场景早已并非仅在测试环境中发生，在阿里巴巴平台的客服机器人“阿里小蜜”的日常应用中，此类较为复杂的阅读理解场景早已成为AI机器人发挥实质性作用的“赛场”。

在阿里巴巴早前公布的一段视频中，阿里小蜜已经能够以文字和语音等形式，与消费者进行多轮次的复杂对话，问题覆盖售前售后服务中，常见的打断、指代、省略、转换话题等现实情况。

阿里小蜜被突然打断对话

这也是阿里巴巴AI技术显著区别于学界竞争者的最大不同之处，阿里AI模型在阿里小蜜系列产品的长期实际应用中得到完善和突破，其技术能力立足现实场景，注重与人类对话的真实互动体验，因此能够在QuAC这类测试中达到接近人类对话的水平。

阿里AI模型摘下世界大赛桂冠阅读理解能力测试刷新世界纪录中国营销网

上一篇：OPPODEVELOPERDAY上海站如期而至携手开发者互惠共赢

下一篇：华为5G+C-V2X车载通信技术被评为全球新能源汽车创新技术

热点推荐

第38届中国（郑州）糖酒食品交易会

2026-06-24
冠军1000万，出自手艺人！手艺人酒重磅加码，台球史上首个冠军1000万！

2026-06-11
第十七届虎啸奖揭晓｜鲸鸿动能荣膺「年度营销技术服务商」，揽获多项大奖

2026-05-30
Aleph 利用Spotify广告解决方案助力中国品牌出海

2026-05-28

推荐会员more >>

主页

newloong

3D产品配置器电子商务网站开发。微信：newloong07, 电话：0755-26780885

2020-02-22 加入深圳
主页

AI搜索老胡

vx：hxwu418

2021-09-27 加入上海
主页

panwenfu

基于家族经销商生意，自身作为经销商业主，从事商品经销行业二十余年，期间在数个著名企业兼任业务经理及培训师等职。

2019-11-12 加入上海
主页

15311812802

海外展会迪拜俄罗斯哈萨克斯坦美国韩国越南泰国菲律宾澳大利亚意大利德国，印尼，印度巴西，

2025-12-01 加入上海
主页

老邱谈营销

实战落地营销专家，二十余年经验，热爱培训咨询，专注于米面粮油、调味料领域。擅长米粉/米线门店引流与利润提升方案输出和品牌定位。18160719055（微信同）

2022-01-05 加入江西南昌