当AIGC在图文和视频领域掀起波澜,音频行业终于迎来了一个真正意义上的系统性玩家。
3月30日,由原懒人听书核心团队创立的万象有声正式开启全行业公测,试图用一套完整的技术方案回应有声内容市场长期存在的供给困境。
中国有声阅读用户已超6亿,用户对“广播剧级”沉浸体验的需求持续攀升,但供给端却被高成本、低效率和品控难题死死卡住。
真人精品制作的单小时成本动辄上千元,一个标准有声书项目从立项到交付通常需要30到60天,这直接导致阅文等平台上大量中腰部IP成为难以快速变现的“堰塞湖”,TME等音频平台也苦于优质内容供给不足。
万象有声的切入点很明确,试图用一套覆盖画本、对轨、录制、剪辑、审听全流程的平台,打破这个僵局。
这支团队的特殊之处在于他们对行业的理解深度。创始成员全部来自懒人听书原创始人及产品、技术、内容制作核心管理层,主导过平台从零到一乃至被腾讯音乐收购的全过程。
他们提出的“双轨制生产引擎”值得注意,一轨是为真人创作者提供智能工具,将配音中的气口、停顿、情绪衔接等过去依赖经验的环节转化为可量化的算法,智能对轨据称能将后期效率提升500%;另一轨则是全自动AI多播有声剧制作,针对海量中长尾IP进行批量转化。
在内测阶段,一个原本需要30天的有声书项目被压缩至5到7天,有资深CV反馈产能几乎翻了一番。
阅米文化创始人李吉的评价更值得玩味,他认为万象有声的AI播音在情感传达上已接近真人水准,且“这种能力的稳定性比单纯的速度提升更为重要”。
这指向了音频行业一个容易被忽视的问题,稳定输出的品控能力可能比偶尔的高光表现更有商业价值。
但这里需要追问的是,当ElevenLabs、Murf AI等国际玩家已经在语音合成的情感丰富度上建立起技术认知,当国内有声市场已经存在一批AI配音工具,万象有声的护城河究竟在哪里?
从目前披露的信息看,其差异化可能不在语音合成算法本身,而在于将行业操作标准转化为算法规则的能力,以及针对玄幻、修仙网文建立的百万级发音字典和角色一致性算法。
简单说,他们试图用懂行业来弥补单纯技术指标的差距。
商业模型的设计也反映出团队对音频制作场景多样性的认知。
纯真人制作场景走SaaS会员订阅,纯AI生产场景按量付费,AI+真人混合场景则提供组合方案,这种将订阅、消耗与扩展解耦的做法,避免了“一刀切”收费造成的用户排他效应。
这种精细化分层的思路,或许比单纯比拼语音合成参数更能体现行业老兵的价值。
另一个值得关注的视角来自来福电台创始人焦可,他认为AI时代的音频产品形态不应该是工具或平台,而应该是“人”,造AI主播,通过长期陪伴建立情感连接。
万象有声的路径显然不同,他们更像在搭建基础设施,为版权方和创作者提供生产能力,而非直接面向听众输出主播人格。
两种路径孰优孰劣,目前尚无定论。
回到那个核心问题,万象有声能否真正打破有声内容生产的“不可能三角”?从内测数据看,效率和成本层面确实取得了进展,但品控能力需要更大规模的市场验证。
当阅文、TME等平台的中腰部IP开始批量转化为有声内容,用户是否会为这些“准广播剧”买单,才是真正的试金石。



