AI时代的AR眼镜进化:替代智能手机的下一代交互方式?
2018-09-14 12:11 悉见科技 AR眼镜 人工智能

AI加持下,AR眼镜正成为科技界新的硬件风口。

文 | 杨洁   编辑 | 黑智

AR眼镜正成为科技界新的硬件风口。

当年的谷歌眼镜Google Glass打开了人们对下一代交互方式的想象,但是几年前那一波AR+VR热潮中的产品,却大多数在今天都已经失败。其中不乏谷歌和英特尔这样的巨头,以及跳票多年的MagicLeap这样的创业新星。微软的HoloLens作为其中已经相当成熟的产品,却因为性价比,在消费级市场上难以大行其道。

但时间到了近两年,一切却又仿佛有了变化。

2017年,苹果发布了AR开发平台ARkit;随后,谷歌ARCore发布。MagicLeap的产品也终于现出了问世的曙光。在国内,今日头条推出AR平台Byted Effect,商汤科技也推出了AR开发者平台Sense AR。AR又成为巨头和创业公司们关注的对象,并在CES等国际展馆上再次引领风向。

但当下,和当年谷歌眼镜等产品所处的时代,已经有了根本的改变。人工智能第三次浪潮已经走向深化应用落地,AI语音、自然语言处理和计算机视觉等技术已经取得了突破性进展。AR眼镜正在被AI加持,而业界对其所寄予的期望也是,它是否能在解放人类双手的前提下,替代智能手机、真正成为下一代智能交互方式。

“对AR行业而言,人工智能技术的发展,已经到了临界点。”悉见科技创始人刘洋对i黑马&黑智说。

今年8月,悉见科技获得了1.2亿元A1/A2轮融资,该轮由联想之星、金科君创、谷银基金、百度创始七剑客雷鸣、前小米公司高管、亚马逊公司高管以及产业基金联合投资。

外界对悉见科技的认知,更多地是其推出的AR眼镜产品。但刘洋表示,悉见科技对自己的定位,一直是打造混合现实大脑的AI公司。随着新一轮融资的公布,悉见推出了第二代AR眼镜XMAN,同时对外发布的,还有悉见的商用XR云xarc.ai开发者平台。

悉见科技“软件+云+硬件”的产品策略,也更加清晰。当众多厂商还在理解图像的状态下,悉见科技已经开始实现在复杂场景下对空间的理解。在刘洋看来,随着XR云的发布,悉见科技推动的技术工具化和平台化,也将加快行业智能化和交互化的步伐。

针对消费级的AR眼镜技术还有待进一步磨炼。而在B端市场上,AR眼镜的应用空间已经开始拓展。在刘洋看来,打开C端市场,AR眼镜可能还需要三年左右的时间;而在已经起步的AI时代,在文旅、安防、工业等行业,AR硬件已经在提升用户体验和效率方面打开市场。

智能手机的信息交互方式仍旧有限,而在视觉技术的加持下,AR眼镜,距离真正成为新一代交互平台,又还有多远?

悉见科技创始人 刘洋

下一代计算平台

提到AR眼镜,很多人首先会联想到2012年谷歌发布的谷歌眼镜。2014-2015年的那一波智能硬件创业潮中,谷歌眼镜也成为了众多创业公司效仿的对象。但这波热浪很快就戛然而止。2015年初,谷歌也停止了谷歌眼镜的2C业务。

悉见科技成立的2016年,上一轮AR创业风口已经过去,那一波智能硬件的风潮也已经走向冷静。但对于刘洋而言,那正是他看到行业转折点的开始。

“悉见科技的初衷,并不是要做一家单纯的硬件公司。”刘洋说。

从中学就对电子游戏感兴趣的刘洋,在考入北京大学计算机系后,也开始从事AR相关的计算机视觉和图像算法的研究,想要站在学术的前沿,发现下一代的交互方式。而在学习期间,他感受到,产业界所要解决的问题,是更大的挑战。因此,在硕士毕业后,刘洋放弃了读博的机会,先后加入网易有道和小米,并曾做出了网易八方、网易饭饭、小米推送等产品。

“下一代的交互方式”,一直是刘洋所思考的问题。电脑的图形交互第一次改变了世界,而智能手机的多点触控,把移动互联网时代和PC时代彻底区分开来。而在我们探索物理世界的数字化、智能化过程中,在PC时代和移动互联网时代,真实世界和虚拟世界仍然是被分割在屏幕的内外。而在刘洋看来,未来新的交互方式,则将可以稳定的实现对三维空间的理解、物体的追踪等,连接起物理空间和数字空间,在虚实结合的空间里,实现多个维度间的交互。

换句话说,未来的设备,将是机器可以模拟人类,“看懂”物理世界。

视觉和听觉是人类接受信息的主要方式。当我们需要解放双手,AR眼镜自然就成了人们寄予期望的下一代交互平台。也因此,谷歌眼镜的诞生,引发了多数人的兴趣。

但是谷歌眼镜在刘洋看来,仍然是基于可穿戴设备的思路来设计的。它只是简单地具备显示时间、天气、拍照等功能,却不能满足更多的需求。与这一观点相对应的是,2015-2016年,前一波智能硬件创业公司经历了“死亡谷”。

但对于刘洋自己而言,创业的时机,却在那时已经来临。

2015年,微软HoloLens发布。刘洋认为,这是一款终于具备了“计算平台”思路的产品。尽管更重要的是,“对于AR行业而言,人工智能技术,也已经发展到了临界点。”

人工智能的第三次浪潮,让AI技术具备了落地的可能。互联网和移动互联时代积累了海量数据,语音和图像识别技术的日趋成熟,深度学习和机器学习不断发展,计算的成本不断下降、服务器也越来越强大。算法、算力和数据的提升,尤其是计算机视觉技术的提升,已经开始具备理解三维世界的能力。

时代机会来临。增强现实和人工智能汇聚,到了“强化人”的能力的时候。

2015年,刘洋离职创业。2016年,悉见科技正式成立。它并不是局限于AR硬件,而是主打软件、AI算法和服务,让硬件具有更好的表现力,而不是仅仅局限在AR眼镜终端。“终端是手机还是眼镜,是根据产业的发展进程而决定。”

悉见为自己搭建了“AR+AI+Assistant”的愿景。在当时,尽管处于AR行业的低谷和资本的冷静期,悉见科技的定位和规划也仍然得到了投资方的认可。2016年3月,悉见科技获得获数百万元天使轮融资;2017年4月,又拿到千万元级Pre-A轮融资。以及最近一次,获得1.2亿元最新融资。

从B端落地

2017年5月,悉见的第一款AR眼镜产品问世并实现量产,针对的主要是B端行业客户。

“AR行业发展未来最大的量仍然是在C端,服务终端消费者。”刘洋说。但是AR产品是否能够实现在消费级市场的普及,还是要看技术层面是否成熟。他将AR整体技术分为感知、计算、呈现、交互、内容、传输六大模块,而目前无论是感知能力、算法、计算能力等,都还没有达到能够支撑消费级市场的程度。即使是微软的HoloLens,也仍然在产品的轻便性、价格甚至性能上,无法做到真正适应C端的需求。对于复杂场景的理解和计算,则更加需要时间。“AR硬件实现消费级应用,至少还需要三年时间。”刘洋判断。

但是人工智能技术的发展,却已经为AR硬件在B端落地提供了条件。

悉见科技的首款 AR 眼镜产品 SeengeneX1S是款双目一体机,重量控制在166克,采用三星Exynos 8890处理器,分辨率为1080P*2,视场角为45°。另外在一些产品细节上,诸如可调节鼻托、可替换左右眼不同的近视镜片,也进行了仔细设计。这款产品主要用于文旅行业,诸如景区旅游、博物馆导览以及房地产等场景。

不同于消费级应用,行业应用场景定义受限,用户只实现有限功能,但对技术尚处于成熟期的AR硬件而言,却提供了落地的可能。“我们可以在功能和硬件整体设计上做约束,从而实现受限场景上的优化体验。”刘洋说。

早期AR眼镜市场正从B2B2C模式发展起来。在前期类似支付宝扫五福这样的应用,已经为市场提供了早期教育。消费升级和技术升级的推动,也让企业级客户将提高效率和体验,作为日后需求的重点。而悉见科技也已经发现,不仅是消费升级的需求,随着AI技术在安防和工业等领域的理解程度深化,AR眼镜的应用场景也从中被发掘出来。

在8月,悉见的第二代AR眼镜XMAN发布。第二代产品完成了强大的视觉AI加持,也更加轻便,重量仅为33克,采用AI芯片麒麟970,每分钟可以识别超过2000张图片。悉见在感知技术上的积累在这款产品上得到了更充分体现,XMAN对低质量图片和背景复杂的人群,也可以实时抓拍。

“这是根据我们最近两年收集到的另一类庞大的客户群体需求推出的产品。”刘洋说。这款产品是分体机设计,头戴部分和主机可以分离;同时在人体工学设计上更加下功夫,让日常佩戴更加方便。它可以支持人脸识别、车牌识别、空间定位等功能,主要针对安防、工业以及二手车作业等目标场景。

三层业务模式

经过了创业之初的早期研发,以及2017年开始在产品和商业模式上的探索与积累,在2018年获得新一轮融资后,悉见科技的“软件+云+硬件”的架构,也终于初步形成。

2017年中,悉见的核心技术攻关团队开始了XR云及相关组件研发。在今年8月,悉见科技XR云xarc.ai正式对外发布,刘洋称之为悉见科技“最核心的技术”。

和市面上其他的AR应用软件相比,XR云xarc.ai主要解决的是AR应用体验持久化、多人交互化以及现实融合感的问题。目前市场上的许多AR应用体验都是基于图片识别或平面检测实现的,无法将虚拟场景进行持久化,所以用户只能碎片化体验。而XR云解决的,就是这个问题。它能够将超大场景的混合现实地图采集、重建,提供反向定位信息,实时加载虚拟世界内容,并通过共享坐标系,让让虚拟世界和真实世界坐标系合二为一。多个设备也可以在同一场景里,实现稳定的实时混合现实多人交互。

在刘洋看来,在PC时代和智能手机时代分隔在屏幕两端的世界,通过XR云新的空间智能机制,能够实现更自然地同时访问虚拟和真实世界。

由此,悉见科技的数据层、业务层、产品层三层业务模式,也初步搭建起来。

xarc.ai高精度商业XR云即是其中的数据层。通过将AR和AI技术平台化,赋能给众多行业开发者。而同时,对悉见科技而言,更为重要的是,平台上不断积累的悉见科技采集以及来自合作伙伴的数据资产。

物理世界的数字化进程,仍然在快速推进中。我们的日常生活和工作,每天都在产生着大量的数据,但是它们还没有完全被收集。“这就是创业公司的机会。”刘洋说。而这些数据量也将远远超过之前的互联网数据,也是未来AI时代的基础。

刘洋和自己的投资方进行过深谈。而他们一致认可的是,在未来会有多家类似BAT规模的巨头诞生,而它们依赖的数据,是有别于现在在搜索引擎上收集到的数据,现在还没有产生。而作为一家创业公司,收集这些数据,则是悉见科技未来的壁垒所在,也是AR行业商业价值开发的基石。

悉见科技的业务层即XaaS,“X”代表悉见,意味着悉见即服务。产品层则包括系列AR硬件产品。基于悉见的软件平台技术,根据客户需求,提供定制化的完整行业解决方案。

在软件方面,悉见已经拥有了高精度 SLAM 算法、低功耗离线场景重建算法、分布式实时 SLAM 算法、多物体实时识别跟踪等算法专利,并基于安卓系统定制出了自己的 XIUI OS 操作系统。除了相关AR硬件之外,刘洋表示,悉见也在进行自研芯片的研发。

刘洋向i黑马&黑智透露,在悉见内部,还有一个神秘的团队,名为XJ101。“他们是没有KPI要求的,”刘洋说。悉见给这个团队的要求,就是去探索新的交互方式,未来可能的现象级APP和硬件的突破口在哪里。“他们做的事情也许现在并不是刚需,”刘洋说,“但是,也有一句话说,‘有一种刚需叫做不被时代抛弃’。”

悉见科技还很年轻,商业模式还在初步形成阶段,但是对于从大型互联网公司历练过的团队而言,这已经是一个清晰且经过思考的架构。在刘洋看来,“往前再推五年,是没有问题的。”

对于AI领域而言,人才成为竞争的核心。为了解决这一问题,悉见在内部搭建培养机制;并且在外部,正与北京大学筹办北大-信科悉见智能技术联合研究中心,以实现空间智能、视觉计算相关的前沿课题研究和学术成果的转化,并为多所高校院所的学生,提供专项悉见奖学金。此外,刘洋还表示,悉见还将发起“超级实习生”计划,吸纳更多顶级人才。

现在仍然还是个弱人工智能的时代。然而,让AR设备成为每个人工作和生活的智能助理,让每个人“随时随地,洞悉所见”的进程,已然起步。