i黑马讯 6月9日,是科大讯飞成立的25周年。在司庆活动上,董事长刘庆峰在内部讲话中深入分析了如何看待语音和大模型的战略机遇、如何看待科大讯飞当前竞争态势、如何打赢大模型之战这三大问题,并坦言科大讯飞正经历创业以来最充满挑战、最扣人心弦、最激动人心的历史时刻。
同时,刘庆峰强调了从技术中来到产品中去的产品导向,通过五大核心战略来打赢大模型之战。
坚守十年,迎来语音和大模型的全新战略机遇
1999年,科大讯飞创始团队定下公司使命“让机器能听会说,实现人类和人机信息沟通无障碍”。2014年,科大讯飞做出战略判断,提出下一个发展阶段从“智能语音”到“认知智能”,“让机器能听会说,能理解会思考”。坚守十年之后,科大讯飞在2024年迎来了前所未有的全新战略机遇。
如何看待语音产业和大模型的全新战略机遇?
刘庆峰表示,原来的语音合成、语音识别、机器翻译等单点技术,通过大模型的理解能力、文本生成能力在后台加持提升,实现了语义理解、指令跟随、多轮对话、情绪感知、超拟人合成,真正使得语音交互得到提升。
“在这个背景下,语音领域的几乎所有应用都值得用新方式重构一遍,这就是现如今语音产业的全新战略机遇。”刘庆峰说,医疗导诊机器人、酒店服务机器人、所有企业的客服机器人等都可以重新做一遍;7×24小时营业场所的部分岗位、企业中的服务类岗位等都可以用数字员工;汽车、手机、家庭助手等终端的智能语音服务也能得到很大提升。类似的应用领域非常多,产业空间巨大。
他分析,GPT-4o对万物互联时代语音浪潮的推动,类似于当年Siri对语音应用的推动。它备受关注的原因有几个点:超拟人合成,使得说话不再是朗读腔调,而是真的像人一样自由对话;全双工交互,可以同时(瞬时)进行信号的双向传输,人机对话可以随时打断和继续;通过语音到语音的端到端建模实现快速反应的极致交互体验。
目前,全双工技术方面,科大讯飞早在2016年就定义了万物互联时代的人机交互标准,包括远场、多人、全双工这些特性,2020年1月,在韩国釜山举行的ISO/IEC JTC 1/SC 35全会上,科大讯飞主导提出了全双工语音交互国际标准,2023年5月正式颁发。端到端的语音技术,背后有语音识别、文本生成、语音合成的过程,今年6月27日,讯飞星火V4.0发布也将给大家展示最新的端到端落地成果;端到端的语音技术建模,科大讯飞有全栈技术方案,也排在计划中,需要算力和时间去实施,预计三季度推向市场。除此之外,科大讯飞还可提供GPT-4o没有的一句话复刻、高噪音场景语音识别、多方言多语种免切换功能。
“大模型时代的语音技术本质上是一次推动万物互联和原有人机交互场景重构的巨大产业机会,科大讯飞一定能够抓住最好的核心技术和应用的红利。”
刘庆峰透露,下一步,科大讯飞将发力远场高噪音多人说话场景、高表现力个性化场景、云边端一体化、软硬件一体化,从技术优势、市场先机、落地成效构建全方位持续领先优势。
从技术中来到产品中去 打赢大模型之战的5大核心战略
站在语音和大模型全新的战略机遇交汇处,科大讯飞究竟要如何打赢这场大模型之战?
刘庆峰分析,大模型时代科大讯飞核心战略组成包括:第一,赋能现有的软硬件和行业产品,形成基本盘。背靠科大讯飞的根据地业务,深入教育、医疗、工业、汽车、家电等行业赛道,同时打造基于大模型的翻译机、学习机等王牌硬件产品。第二,开拓以央国企为代表的重点行业客户市场。按照大模型能力可达程度的三个台阶,提供真正解决行业和企业刚需的方案。第三,开辟新兴赛道的软硬件一体化授权和新硬件机遇。比如机器人硬件、医疗硬件等。第四,在万物互联时代,AI助手的入口级战略机遇。以“能听会说”为前端,以“能理解会思考”为后端,将极大推动万物互联时代进程。第五,推进“讯飞超脑2030”计划,迈向家庭陪伴机器人的万亿市场。
讯飞的人工智能产业生态也在蓬勃发展,去年5月以来,讯飞开放平台的开发者团队增加了200万以上、总数增长了66%,大模型相关注册开发者团队51万,其中企业开发者32万、个人开发者19万。其中不仅仅提供软件,更有软硬件一体化解决方案。
刘庆峰表示,大模型应用落地的一个关键是云边端一体化和软硬件一体化,在底座能力和垂直方向上要做透还要做好,用更小的算力做出相对更优效果。“在云侧,我们有很好的大参数的通用模型(各种不同尺寸都有),也有星火一体机、‘飞星一号’算力平台等完全自主可控的硬件支撑;在边、端侧,科大讯飞有在汽车等行业落地的中等参数模型和软硬件一体化方案,也有完全能够在手机等智能终端上安装和使用的‘小’模型和方案。从而形成了云边端一体化和软硬件一体化的综合落地优势。”
船到中流浪更急,刘庆峰说,抓住大模型红利的关键,最重要的还是“顶天立地”:核心技术保持业界领先,大模型底座做到领先,云边端软硬一体化做到领先。“从技术中来,到产品中去,才能真正改变世界。”聚焦市场导向,做出典型领域的刚需产品,“把大模型赋能做到实处,把市场空间真正激发,这是我们要做的事。”
会上,刘庆峰也明确,科大讯飞价值观的第一个就是一切为客户创造价值,公司下一步也将通过一系列机制推动面向战略市场领域的产品聚焦,让产品最终能真正给客户创造刚性的价值,可衡量、可评价。
“本轮的通用人工智能,从国内外的发展看都是‘大平台加英雄主义’,没有通用大模型的底座能力,没有算法、数据等各方面的积累,就没有办法做出改变世界的大模型应用和产品。所以必须站在大平台之上。”刘庆峰说,从底座能力和承担的国家战略任务看,讯飞星火就是这个大平台,再往后大平台属性还会进一步增强;除此之外,还要有英雄主义,让每个人的创造力真正被激发出来,成为充满想象力、充满战斗力、充满开拓精神的英雄。