4月29日,由WWW 2025、淘天集团、之江实验室及天池平台共同发起的产学研一体化国际赛事“多模态对话系统意图识别挑战赛”,在悉尼举办的WWW 2025大会上正式揭晓了获奖名单:来自东南大学&杭州宇谷科技、浙江大学、大连理工大学&中国科学院大学的三支队伍分别获得金、银、铜奖,并有五篇获奖论文被WWW 2025收录。
据悉,WWW即国际万维网大会(International World Wide Web Conference),是CCF-A类国际顶级会议之一。今年是WWW首次公开举办挑战赛,并与Google、淘天集团、清华大学等海内外知名企业或学府合作设立了五个赛道。
其中,由淘天集团主办的赛事聚焦电商领域中的客户服务场景,通过利用先进的大型语言模型(LLM)技术,高效准确识别客服对话中的多模态意图,可以大幅提升客户体验和服务质量。以此为出发点,该挑战赛与电商真实客服场景中的技术痛点精准对接,赛题覆盖复杂多模态场景和多轮对话中的意图识别(超40类电商细分任务)。模型需满足严格部署要求,考验参赛者对轻量化多模态技术的创新能力。
WWW 2025“多模态意图识别挑战赛”颁奖现场
“互联网是一个持续演化的生态系统,服务类型、接入方式、传播模式、商业模式和技术范式都在不断演进。其核心在于通过创造更高效、便捷的服务方式,全面提升社会的生产效率。”WWW 2025程序委员会主席、悉尼科技大学教授 Guodong Long表示,“作为互联网技术领域的旗舰会议,WWW会议始终走在前沿。在悉尼举行的WWW 2025,进一步突出了互联网作‘桥梁’的角色——连接人与人、人与物、以及人与人工智能体。”
据了解,WWW 2025 “多模态对话系统意图识别挑战赛”从去年10月开始接受报名,全球范围整体报名团队数量超过1600支,经过初赛和复赛两轮激烈的竞争博弈以及专家评审,最终共评选出金、银、铜及优秀奖共九支获奖队伍,主要来自东南大学、浙江大学、中山大学、中国科学院大学、大连理工大学、南京理工大学等国内高校。值得注意的是,共有五篇获奖论文被WWW 2025 收录。
收录论文主要针对电商领域多模态对话场景的意图识别问题。冠军队伍提出了IntentionGPT的方案,基于多agent协作的数据增强技术,基于GAT的RAG增强,最后通过Model Soup的模型融合方式来综合解决面临的数据稀缺和领域适配问题。有论文提出EcomMIR框架,结合优化对比学习模型CN-CLIP与多模态大语言模型MiniCPM-V,针对性解决电商领域多模态意图识别难题;另一篇论文提出了一套多模态客服意图的数据增强以及模型融合的CuSMer框架,有效提高LLMs在处理客户服务中的多模态用户生成内容时的鲁棒性和理解能力。
AI浪潮席卷各行各业,而电商正是目前AI技术的核心商业应用场景之一。尤其在客服场景,据了解,淘宝天猫平台已有上百万商家使用智能客服店小蜜等AI工具,以大幅度降低客服接待成本和提升接待效果。而随着意图识别技术的进一步突破,AI客服能够更精准地理解消费者需求,进一步提升服务质量与效率。
Guodong Long对此表示:“本届大会与淘天集团联合举办的多模态智能体竞赛,开辟了一个全新的探索方向:通过多模态智能技术,让互联网客户服务更加智能和精准。来自全球的1600支参赛队伍,充分展现了这一领域的强大生命力。这场比赛更像是在播撒种子,孕育未来的创新者。或许,下一个颠覆性的技术转折点,就将诞生在这些参赛者之中。”