“含光”剑出,谁与争锋?阿里重磅发布首颗AI芯片含光800
2019-09-25 17:05 含光800 阿里AI芯片

2“含光”剑出,谁与争锋?阿里重磅发布首颗AI芯片含光800

作者:夕颜、胡巍巍

来源: CSDN、AI 科技大本营

9 月末的杭州气温适宜,宜出游,宜在湖边餐厅浅酌一杯清茶消闲。但在钱塘江水支流河畔的云栖小镇,却完全一副与闲适氛围不相称的热闹景象。

因为今天,阿里巴巴一年一度的云栖大会在这里正式开幕,早上 8 点钟不到,会场外早已人头攒动。杭州市人民政府副市长柯吉欣表示,今年云栖大会的参会嘉宾超过八万人。

进入主会场后,格子衬衫成了会前一道亮丽的风景线。

乐队激情开唱,为大会助阵。

开幕式和精彩的“前菜”过后,2019年云栖大会正式拉开帷幕,阿里巴巴集团首席技术官兼阿里云智能总裁、达摩院院长张建锋紧接着逍遥子之后发表了题为《构建数字经济基础设施》的演讲。

张建锋,花名行癫,2004 年加入淘宝,担任首席架构师,此后一直在淘宝工作,阿里巴巴集团合伙人之一。现任阿里巴巴集团首席技术官(CTO)兼任阿里云事业群首席技术官(CTO)、中台事业群总裁、集团技术战略执行小组组长,2018 年 11 月 26 日阿里组织架构调整之后,张建锋兼任阿里云智能事业群总裁,向阿里巴巴集团 CEO 张勇汇报。

以下为演讲亮点提炼:

平头哥出新!全球最高性能 AI 推理芯片含光800发布

会上,张建锋宣布了阿里巴巴平头哥重磅发布:AI 推理芯片含光 800,在 AI 场景中对异构计算做了补充。

“含光”一出,便在现场引起了热烈的掌声,张建锋介绍道,在业界标准的 ResNet-50测试中,含光 800 推理性能达到 78563 IPS,比目前业界最好的 AI 芯片性能高 4 倍;能效比 500 IPS/W,是第二名的 3.3倍。

张建锋说:“在全球芯片领域,阿里巴巴是一个新人,玄铁和含光 800 是平头哥的万里长征第一步,我们还有很长的路要走。”

含光其名,源自上古三大神剑之一「含光剑」,该剑含而不露,光而不耀,正如含光 800 带来的无形却强劲的算力。在杭州城市大脑的业务测试中,1 颗含光 800 的算力相当于 10 颗 GPU。

据阿里官方介绍,含光 800 性能的突破得益于软硬件的协同创新:硬件层面采用创新低自研芯片架构,针对深度学习中使用的大量权重参数和张量数据,在支持稀疏压缩与量化处理的基础上,通过独特设计的数据访存与流水线处理技术,大大减低了 I/O 需求和数据的搬移,NPU 同时深度优化了卷积、矩阵乘、向量计算和各种激活函数,通过高有效的硬件资源调度和全并行的数据流处理,有效解决芯片性能瓶颈问题;软件层面集成了达摩院先进算法,针对 CNN 及视觉类算法深度优化计算、存储密度,可实现大网络模型在一颗 NPU 上完成计算。此外,它还拥有自动化开发工具,支持 TensorFlow、Caffe 等主流开源框架,还可进行多模型动态部署。

含光 800 已开始应用在阿里巴巴内部核心业务中。根据云栖大会的现场演示,在城市大脑中实时处理杭州主城区交通视频,需要 40 颗传统GPU,延时为 300ms,使用含光 800 仅需 4 颗,延时降至 150 ms。拍立淘商品库每天新增 10 亿商品图片,使用传统 GPU 算力识别需要 1 小时,使用含光 800 后可缩减至 5 分钟。

此外,含光 800 将通过阿里云对外输出 AI 算力。基于含光 800 的 AI 云服务也在今天正式上线,相比传统 GPU 算力,性价比提升 100%,对于受限于算力瓶颈的企业而言,含光 800 可以更高效地运行更复杂、更先进的算法。

过去一年,平头哥团队在不断探索芯片与场景的融合,如对算力需求较大的图像视频分析、搜索、推荐等业务场景。围绕这一目标,平头哥针对场景深度定制了芯片的软硬件,例如自研了架构、软件编译器、框架、工具链等,如先后发布的玄铁 910、无剑 SoC 平台,后期也针对 INT8数据类型做了大量优化。

张建锋表示,端云一体芯片是平头哥的主要方向,终端玄铁处理器可以与云端含光 800芯片协同。

平头哥模式:端云一体芯片生态为各行业提供普惠算力

一年前,阿里宣布要自研芯片,短短一年时间之内,含光 800 即问世,且芯片的设计、流片整过程极短,据悉,平头哥团队 7 个月就完成了含光 800 的前端设计,之后仅用了 3 个月就成功流片。

出手快准狠,阿里平头哥做芯片的决心和能力都不容小觑。

和绝大多数芯片商不同的是,平头哥的目的并非卖芯片,而是开辟了全新的商业模式(平头哥模式),致力于为企业提供普惠算力。

随着含光 800 的发布,平头哥端云一体全栈产品系列初步成型,涵盖处理器IP、一站式芯片设计平台和 AI 芯片,实现了芯片设计链路的全覆盖。

平头哥团队表示,AIoT 场景需要新的计算架构,需要安全、在线和智能等新的特性,所有芯片面临升级,这必将在芯片行业将引起一波全新技术革命和产业浪潮。但 AIoT 市场有强应用驱动和场景碎片化等特点,芯片公司按照传统的方式设计芯片很难适应未来的需求,平头哥希望通过端云一体芯片生态为各行业提供普惠算力。

未来,平头哥的产品形态还会进一步完善,例如推出云上 AI 训练芯片和端上 AI 推理芯片,目前平头哥还在研发用于阿里云神龙服务器的 SoC 专用芯片,以满足更多场景的算力需求。

数字化经济四大关键技术

除了这一重磅发布之外,张建锋在演讲中还介绍了阿里巴巴在数字化建设中所做的工作和成果。

阿里巴巴的核心使命之一就是构建数字经济基础设施。张建锋说道,在数据大爆炸的时代,数据成为核心资源,数据相当于农业社会的石油,算力相当于工业时代的发电机。如今,数字经济发展迅速,全球数据呈增张趋势,若干年后将达到 175 ZB 的规模。数据显示,2018 年,数据对我国 GDP 增长的贡献率达 67.9%,连续 5 年贡献率超过 50%。没有数字化对经济的影响,相当于没有计算机对信息化的影响。

他认为,数字经济驱动着经济变革,全要素数字化升级成为数字经济发展的新动能,从需求到生产,从供应到消费,数据成为数字经济发展强有力的驱动力。

他还指出,现代信息技术在驱动数字化转型的进程中发挥着核心作用,是数字经济的基础。他将数字化经济需要的技术总结为四大关键点:可靠易用的云、全局智能的大数据、云端一体的智联网和随时随地的移动协同。

从去年开始,阿里云升级为阿里云智能,云第一次把 IT 技术从端到端的设施集成到云端,完成了一次变革,让企业和个人可从云端获得稳定、便捷、低成本、可靠的算力。

其中,可靠易用的云是数字经济的基础设施。对于企业来说,上云是一号位战略决策,一定要从技术理念变革和顶层设计层面推动。

另外,大数据深刻地改变了很多应用,张建锋认为,云与大数据之间有着紧密的联系。有了云,我们可以处理大规模的数据,但两者的结合才是构建数字化的基础。全局智能的大数据技术的全链路处理让数据产生价值,“让数据多跑路”可以让数据集中发挥最大效能,比如浙江省把 92 个部门数据打通之后向数据要智能,累积为 2000 万市民提供服务。

拥有云端一体的智联网在数字化过程中也十分关键。实现一切设备的在线化、实时化是阿里巴巴的目标,为用户提供云端组件、实时化产品和服务,这是智联网的核心。

随后,张建锋还以钉钉为例讲解了随时随地移动协同的重要性。他说道,目前钉钉上已有 1000万以上组织在该平台上实现了在线移动协同,移动化也从消费域进入生产域,移动协同成为数字化经济的一个核心基础设施。

含光 800 的发布使得阿里平头哥端云一体全栈产品系列初步成型,助力阿里在数字经济基础设施构建中“再下一城”。未来,阿里端云一体的芯片生态能在全球芯片技术升级和产业浪潮中走多远,我们拭目以待。