深度解析英特尔Ice Lake:横跨六大支柱的创新
2019-06-13 17:16 英特尔Ice Lake

今年的台北电脑展上,英特尔公司推出了十代酷睿处理器,也就是10nm工艺的Ice Lake处理器,今年6月份出货,量产时间比预期提前了半年。10nm Ice Lake是首发10nm的处理器,也是基于六大技术支柱的创新、可实现指数级性能增长。

  现在已经是以数据为中心的时代了,云服务、大数据、5G、AI、物联网带来的数据量是指数级增长,2018年仅仅是中国就产生了7.6ZB的数据,2025年预计会大幅增加到48.6ZB,全球数据量高达175ZB,这样的增长已经超过了单一处理器性能增长的极限。

  不仅仅是数据量的爆发,还有数据形态的多样化,都对数据的处理提出了更复杂的需求。未来我们连接的设备也不再是数亿级的PC,或者是10亿级的智能手机,随着5G及物联网的发展,未来的时代是万物互联,2025年中国就有800亿智能设备,全球则是1500亿智能设备,纵横交错下对数据的处理、存储、连接都提出了更高要求。

  应对这样的时代,英特尔公司也转变了战略,从以往的以晶体管为中心变成了以数据为中心,转向了六大技术支柱并行的创新,这六大支柱就是制程和封装、架构、内存和存储、互连、安全、软件。英特尔的目标是借助这六大技术支柱,实现指数级的增长。

  在Ice Lake处理器上,先进工艺是10nm,架构是全新的Sunny Cove及Gen11核显,内存上DDR4+傲腾也带来了性能、容量的双重升级,集成雷电3、WiFi 6也扩展了Ice Lake的连接性,安全及软件优化更是重中之重。

制程工艺:先进的2.7倍微缩

  六大技术支柱之中,先进的制造工艺至关重要,是打造领先产品的关键基础,而Ice Lake带来高性能的前提就是10nm工艺的超高晶体管密度。

  从14nm节点,英特尔工艺的升级幅度明显超过了前面几代,22nm到14nm是2.5倍密度,而从14nm再到10nm更是提升到了2.7倍,晶体管密度达到了1MTr/mm2,也就是说一平方毫米空间里就有1亿个晶体管。

  除了晶体管密度上继续符合摩尔定律之外,英特尔的10nm工艺在材料、工艺上还有不少创新之处。之前Techinsights拆解过英特尔10nm芯片,提到英特尔10nm工艺在后端制程BEOL中首次联合使用金属铜及钌,并且使用了自对齐曝光工艺,在新技术上做了很多探索性改进,技术难度要比之前的工艺高得多。

  值得一提的是,英特尔去年推出了名为Foveros的3D封装技术,该技术提供了极大的灵活性,因为设计人员可在新的产品形态中“混搭”不同的技术专利模块与各种存储芯片和I/O配置。

  Foveros封装技术也是六大技术支柱中的重要一环,虽然10nm Ice Lake处理器目前并没有使用Foveros封装技术,不过今年会有Lakefield处理器率先垂范Foveros封装,未来还有更多处理器用上这一技术,芯片从二维走向三维之后也能带来更高的指数级增长。

架构创新:全新Sunny Cove核心,18% IPC性能提升

  除了工艺上的升级之外,Ice Lake处理器上另外一个带来指数级性能增长的创新就是全新架构的应用。英特尔认为,未来十年,架构创新会是他们创新的主要驱动力,继续带来指数级的扩展效应。

  就Ice Lake来说,这次主要的架构升级就是CPU、GPU,其中CPU核心升级到了Sunny Cove,GPU升级到了Gen 11代。

  在CPU核心上,Sunny Cove主要改进可以说是三点——更深、更宽、更智能,具体来说就是:

  - 更深:内部单元增强,L1缓存增加了50%,L2缓存翻倍。

  - 更宽:寻址单元从4个增加到5个,执行单元接口从8个增加到10个等,提高了微架构的并行性能。

  - 更智能:英特尔在Sunny Cove核心上使用了更好的算法,提高了分支预测精度,降低了延迟。

  Sunny Cove核心还提升了某些特定应用的性能,通过增加新的AES、SHA-NI指令提高了加密解密性能,还有解压缩算法,此前英特尔展示的7-ZIP性能提升了高达75%。

  总的来说,在CPU性能上,Sunny Cove内核带来的改变是巨大的,与目前的六代到九代酷睿使用的基于Skylake改进的架构相比,Sunny Cove内核在不同应用中性能提升10-40%不等,平均下来IPC(每指令周期性能)提升了18%之多,这是近年来CPU性能提升最大的一次了。

  除了CPU核心,10nm工艺的Ice Lake处理器在核显GPU上也来了一次飞跃,升级到了Gen 11架构核显。与目前主流CPU使用24个EU执行单元的Gen 9/10核显不同,Gen 11核显的EU单元暴增到64个,频率1.1 GHz,浮点性能高达1.12 TFLOPS,FP16半精度更是高达2.25 TFOPS,是目前核显的2-3倍。

  Ice Lake的GPU规模增长带来的好处就是游戏性能提升了80%以上。据Computex上的信息,48/64单元的Iris Plus核显可以保证多数游戏大作的平均帧率超过30 FPS,部分还能突破60 FPS。

  此外,Gen 11核显在解码、视频输出、垂直同步技术上也有革命性升级,双解码单元支持HEVC、VP9硬解,最高支持4K60、8K30,还支持DP 1.4、HDMI 2.0b,支持三屏独立输出,最高可输出5K60、4K120 10-bit。

  最后,Gen 11核显终于支持了VESA标准的Adaptive Sync自适应垂直同步技术,这是目前游戏显示器光为支持的新一代垂直同步技术,玩游戏时可以避免画面撕裂或者卡顿等问题。

内存升级:DDR4提频 傲腾内存加速

  内存和存储的重要性往往被人忽视。事实上,随着海量数据时代的到来,内存和存储的重要性日趋提升。

  不论是内存还是存储,英特尔认为需要内存层级结构上各层级的指数级提升,以满足当前的计算需求。而傲腾技术的推出,便是英特尔正在重塑内存和存储层级结构,填补层级空白,指数级提升内存性能。

  首先,Ice Lake处理器的内存频率大幅提升,支持LPDDR4-3733MHz内存以及DDR4-3200内存,前者主要用于移动版产品,后者主要是桌面版产品。相比以往较低的内存频率,Ice Lake处理器提升到DDR4-3200内存平均下来会提升30%的内存性能,对游戏及专业应用来说大有裨益。

  2020年还会有Ice Lake服务器版处理器上市,应该是第三代至强可扩展处理器系列了,而从今年的第二代至强可扩展处理器开始,英特尔就开始支持傲腾数据中心持久性内存(Optane DC Persistent Memory),进一步提升存储系统的性能及容量。

  傲腾数据中心持久内存容量目前提供128GB、256GB、512GB,最大功耗18W,频率最高等同于DDR4-2666,读取带宽最高6.8GB/s,写入带宽最高2.3GB/s,性能远高于PCIe硬盘,更接近DDR4内存,可以弥补DDR内存容量小、SSD硬盘性能不足的问题。

互连加速:40Gbps雷电3、WiFi 6

  在这个数据洪流的时代,CPU不只是要处理海量数据,还能够更快速地连接海量数据,这也是Ice Lake处理器不同于其他产品的地方,因为它是第一个集成了雷电3以及WiFi 6的处理器。

  英特尔的Thunderbolt雷电技术发展了数年了,目前最新标准是雷电3,速率高达40Gbps,是USB 3.0的4倍多,传输超大容量的文件也不需要等待太长时间了,拷贝100GB的高清电影只要20秒左右的时间。

  今年3月份英特尔宣布向业界免费开放雷电3授权,而Ice Lake处理器是第一个集成雷电3主控的处理器,进一步降低了雷电3平台的成本及接入难度。

  此外,USB推进组织也宣布未来的USB 4将基于雷电3协议,意味着USB 4不仅拥有同样的40Gbps,而且双方的接口都会统一为USB Type-C,互相兼容。

  目前雷电3已经获得了Windows 10及Linux系统的支持,支持雷电3的PC数量每年翻番增长,超过400多款PC支持雷电3接口了,而支持雷电3的外设数量也超过了450款,同样延续着每年翻番的增长趋势。

  40Gbps的雷电3是有线连接,Ice Lake还在WiFi无线连接上走在了前列,率先整合了WiFi 6,也就是之前的802.11ax无线标准,并且支持160MHz通道和OBSS网络噪音过滤,提升速度的同时增强网络可靠性,特别是改进密集环境中的网络性能。

  这样做的好处就是同样都是WiFi6标准,但是英特尔的网络速度更快,速率可达1680Mbps,是标准2x2 WiFi6 80MHz通道的2倍。

  除了速度更快,英特尔还打造了成本更低、集成度更高的WiFi 6解决方案,Mac物理核心使用了14nm工艺,RF射频使用了28nm工艺,减少了15%的封装面积,同时也减少了40%的针脚。

软件扩展:生态系统突围 AI加速

  英特尔公司有超过1.5万名的软件工程师,软件也是英特尔六大支柱中的关键一环。

  之所以软件生态会受到重视,是因为当前多元化的计算需求之下,全新硬件架构每提升一个数量级的性能,软件优化就能带来两个数量级的性能提升,也就是说现在到了向软件生态要性能的时代了。

  此外,英特尔目前已经拥有了CPU、GPU、FPGA、AI芯片等多种架构产品,为了简化开发者的难度,英特尔将推出One API的战略,可以简化跨CPU、GPU、FPGA、人工智能和其它加速器的各种计算引擎的编程。该项目包括一个全面、统一的开发工具组合,以将软件匹配到能最大程度加速软件代码的硬件上。

  AI是未来几年的重点领域。Ice Lake处理器上集成了AI加速功能,加入支持DLBoost机器学习加速指令,结合GPU核心、低功耗加速器,全面支持Windows ML、Intel OpenVINO、苹果CoreML等框架。

  得益于先进的AI加速指令,Ice Lake处理器的AI性能相比八代酷睿性能可轻松提升2-2.5倍。

  此外,不得不提的就是Ice Lake处理器的安全性,由于10nm Ice Lake是下一代处理器,在设计之初就考虑到了安全防护问题,其安全性是这几代处理器中最高的。

总结:指数级创新驱动英特尔未来增长

  正如前面所说,Ice Lake对英特尔来说不只是新一代处理器,也不是升级10nm工艺那么简单。仅仅依赖制程工艺升级已经无法适应数据洪流时代的计算需求了,10nm Ice Lake处理器正是英特尔实施全新战略的缩影。正如宋继强院长在今年春天的战略纷享会上所言,应对以数据为中心的时代所需的指数级增长,英特尔将依托六大技术支柱来推动计算革命,在以数据为中心的时代继续创新,未来5年、10年甚至50年里,它们将成为英特尔发展的驱动力。