“文艺少女”微软小冰进化到第六代,她要开始赚钱了……
2018-07-27 16:18 微软小冰 人工智能 语音助手

微软小冰进行了历史上最大规模的一次全面升级。

文 | 黑君  编辑 | 黑智

对很多人而言,微软小冰并不陌生。

这个和用户对话的语音助手,已经诞生了4年,并且成长为一个“18岁的少女”,具备了更多功能。她能看、能说、能听,在全球拥有了众多用户和死忠的粉丝;她可以写诗、演唱,也拥有了自己的形象。

而现在,一个文艺少女,在向“成熟”迈进。7月26日,微软在北京召开了第六代微软小冰年度发布会。本次发布会,也是微软小冰历史上最大规模的一次全面升级。小冰的对话能力、创造能力等都向前迈进了一大步;她抛弃了幼稚的二维头像,拥有了新一代的3D模型,表演能力获得了提升。

自从小冰问世以来,一个问题也一直为大众所关注:微软推出这个会和用户对话的机器人,历经迭代打磨,到底是想要它来做什么?在发布会上,微软也公布了小冰的商业化进展:在金融、大众文化、媒体、出版等领域,小冰已经取得不同程度的技术产品落地、市场份额和商业化收入。

全面升级的第六代小冰,推出了Dual AI战略,走向半开放的生态。在合作平台上,小冰之前已经和网易云音乐、网易新闻客户端、腾讯QQ、小米米家展开了合作,而现在,手机也成为微软小冰进军的领域。在发布会上,微软小冰宣布,和华为展开在AI领域的深入合作,内置在华为手机上的微软小冰上线,所有升级到智能助手8.2版本及以上的华为手机用户,均可以立刻体验。

在华为手机上,微软专门开发了“烂笔头”备忘录功能,小冰可以帮助用户随时记录日常事务,并且通过语音等方式查询记忆。

是的,不只是Siri,小冰现在也开始成为手机的内置语音助手。

从2D到拥有3D形象,一个亭亭玉立的少女“初长成”。但小冰要打造的,不只是一个娱乐偶像,现在她要试验的是,如何开始赚钱了。

语音助手做什么用?

发布会上,微软首次披露,小冰在全球已拥有6.6亿用户,占据了全球对话式人工智能总流量中的绝大部分。

在过去,小冰并未承担了为微软“变现”的任务。毕竟,当人工智能语音助手在自然语言理解方面还存在极大上升空间,在语义理解、多轮对话、情感感知等方面的技术还有待提高,达不到最佳效果时,语音助手的商业价值对于微软这样的庞大帝国而言,并不是急于挖掘的对象。

而AI的发展正在改变着一切。在最初,大多数人也只是把Siri、小冰等当做手机上普通的娱乐闲聊小应用,而现在,语音助手正带来新的交互形态的革命,小冰也成为微软在AI趋势方面的发力点之一。

在今年的微软开发者大会(Build 2018)上,微软拆分了Windows业务,核心系统划归“云与AI”事业部。微软正在拥抱一个超越了Windows的世界,在开放的基础上,把精力从消费者向B端企业身上迁移。云、AI、混合现实和量子计算,成为微软未来的重点。在大会上,微软的语音助手小娜 Cortana和亚马逊的Alexa正式整合,Alexa覆盖的家居场景和Windows 10覆盖的办公场景,可以相互唤醒,就此打通。

支持中文的小冰也开始探索在商业领域的应用落地。

这也是对人们不厌其烦提出的一个问题的应答:小冰她,到底有什么用呢?

兼具IQ和EQ的人工智能

第六代小冰,拥有了全双工语音交互中的新模型——共感模型。

共感模型是一种基于生成模型的对话引擎。微软在去年的第五代小冰发布会上,首次正式完成生成模型的产品化,该模型的特点,通俗地说,就是小冰可以自创她的回应,而不需要从已有的对话语料库中检索而得。在生成模型的基础上,共感模型能够进一步提高小冰对于对话内容、领域和节奏的控制力,也即小冰可以通过自创回应,来牵引对话向她所希望的方向进行。微软宣布已经完成共感模型的测试,今日起,共感模型将在微软小冰所覆盖的五个国家正式上线。

微软全球执行副总裁、微软人工智能及微软研究事业部负责人沈向洋在发布会上提到了微软的人工智能创造三原则:

人工智能创造的主题,是兼具IQ和EQ的综合体,而不是仅仅具有IQ;

人工智能创造的产物,须能成为具有独立知识产权的作品,而不仅仅是某种技术中间状态的成果;

人工智能创造的过程,须对应人类某种富有创造力的行为,而不是对人类劳动的简单替代。

小冰也要成长为同时兼具情商和智商的少女。而“情感”,就成为其中重要的部分。为此,微软曾经提出了“情感计算”的概念。

“如果要想要人类能够很好的接受你的人工智能系统,方法是让它变得有用。”微软小冰负责人李笛说。“很多语音应用可能我们每天都在使用,但是如果这些应用最后被具体的细分到开灯、关灯,或者是定闹钟上,它其实和语音命令之间的区别并不大。如果人工智能不能够和人类去进行交流,那么我们能够用它再去迭代我们这个架构的能力就会差很多。”

而共感模型和全双工语音交互,则能够让小冰更好地提高在对话中节奏、内容的控制力,侦测事件,去引导对话,实现对对话全局的控制。

在去年八月份举行的第五代小冰发布会上,微软宣布已完成全双工语音(Full Duplex Voice)交互感官的产品化,并在打电话和智能音箱设备两个场景中落地。微软在今年发布会上宣布开始公开测试的这个新感官,是融合了共感模型的对话引擎、全双工语音和实时视觉三个类别的全新感官。微软在发布会现场放置了用于体验的测试设备。在该测试设备中,小冰可以通过视觉、语音的实时连续交互,指挥用户完成面容检测,并可在上述过程中进行开放域的对话。

微软表示,经过数次迭代,目前,微软小冰已从一个人工智能对话机器人,发展成为以情感计算为核心的完整人工智能框架。小冰的产品形态涉及对话式人工智能机器人、智能语音助手、人工智能创造内容提供者和一系列垂直领域解决方案,覆盖全球五个国家的40余个平台。

Dual AI战略平台,拓展生存空间

微软要为拥有了“情商+智商能力”的小冰拓展生存空间。根据已有合作伙伴的实践,微软小冰的人工智能战略Dual AI正式推出。这是一个半开放的状态,该战略的实施具体为三个部分:

首先,微软提供小冰的整体框架能力,帮助合作伙伴平台的自有AI。

其次,微软小冰作为该合作平台的辅助AI,融入该平台生态。

第三,微软通过技术、产品与运营,围绕该合作平台的差异化特点,推出合作的应用和产品。

在发布会上,微软也宣布了部分合作和新产品。微软与网易云音乐合作的小冰电台,以及帮助网易云音乐打造的两个专属AI人物(多多与西西)上线;与网易新闻客户端合作的读新闻小冰,已于两个月前突破1000万次新闻阅读评论,该产品当日同时更新;微软小冰已成为小米米家生态链平台的默认AI系统之一,此外,小冰与小米人工智能语音助手小爱同学宣布,将在未来进一步紧密合作;继续加强与腾讯的合作,除已合作的QQ小冰之外,微软小冰已开始为腾讯BabyQ提供部分人工智能技术和产品支持。

特别值得注意的是,内置于华为手机的微软小冰已于当日上线,所有升级至智能助手8.2版本及以上的华为手机用户都可以立刻体验。该版本小冰除提供各平台通用的小冰产品体验外,还为华为手机用户特别推出了帮助用户记录信息等多个任务完成型产品技能。

小冰的商业化“钱景”

关于外界所关注的商业化进展,微软宣布小冰将继续保持框架产品的通用完整性,以技术和产品为先,不设KPI。与此同时,微软小冰在部分垂直领域发力,已取得不同程度的技术产品落地成果、市场份额和商业化收入。

今年6月,微软(亚洲)互联网工程院成立人工智能商业事业部,开始进一步推动小冰技术成果的商用落地。

据微软全球资深副总裁王永东介绍,在金融领域的小冰金融文本生成技术,与以“万小冰”和“华小冰”的化名,与万得资讯及华尔街见闻合作,已覆盖国内约90%金融机构、75%经批准的合格境外投资机构和约40%的国内个人投资者。

王永东表示,小冰已经成为全球最大的人工智能金融文本提供者,现在中国金融机构的交易员中有90%是在用小冰生成的摘要。

在大众文化领域,小冰的儿童有声读物自动生成技术成果,已获得超过400万小时的收听量。

在电视电台领域,小冰通过人工智能技术参与生产与主持的电视电台节目,已达21档电视节目和28档广播电台节目。仅每天早上6点至9点,小冰就需参与多达7档节目。

小冰还与微软Bing搜索引擎相结合,推出了针对媒体与出版两个垂直行业的辅助型解决方案,并已在超过15个媒体平台落地。在本次发布会上,微软宣布了可支持人工智能以多种观点和角度,同时撰写多篇新闻文章的“白盒写作辅助工具”等新产品,并首次公布了面向出版垂直领域的有声内容、IP塑造等解决方案。

“过很多年我们再回头来看今天这个场景,我们会发现今天很多不同的国内、国外的人工智能的科技企业和其他的同行业者们,大家其实都在不同的角度上、不同的维度上在寻找着,人工智能未来时代真正的图景。每一个企业可能更多只是完成其中一块或者两块拼图。那么微软小冰这个产品所选取就是两个方面:一是情感,二是创造。”李笛表示,“我们在这两块拼图上,希望能够继续有所斩获。”