您的位置  新兴能源  地热

重振半导体领导者荣光:解读英特尔2021架构日

在半导体领域,英特尔绝对是一家绕不开的公司,作为半导体领域的巨头,英特尔过去为大家带来了相当多的黑科技,同时在CPU市场也是绝对的霸主,只不过近几年AMD的强势让Intel这家半导体巨头倍感压力,旗下的处理器的产品似乎也少了点竞争力。特别是其推出的11代酷睿处理器,遭到了市场的冷落,玩家对此也是兴趣寥寥。

而 12 代酷睿处理器似乎成为了英特尔的一根救命稻草,事实上作为第一款采用性能混合架构的 量产 处理器, 12 代酷睿处理器在曝光之时就受到了消费者的特别关注。而英特尔在今天举办的 2021 架构日上,向公众详细地介绍了 12 代酷睿处理器,并且也介绍了包括 DG2 显卡、 Sapphire Rapids 以及 Ponte Vecchio 等诸多黑科技产品,向世人们证明自己才是半导体领域真正的大哥。可以说干货满满,下面我们就通过这篇文章为大家带来对于英特尔 2021 架构日的解读。

作为和大家息息相关的硬件,英特尔的12代酷睿处理器自然是值得一说的,在遭遇了11代酷睿处理器的滑铁卢之后,英特尔也希望能够通过12代酷睿处理器再次夺取CPU王者的地位。

首先是架构,过去很长一段时间内, X86 架构的 CPU 都采用了相同的核心,而现在英特尔终于将性能混合架构带入到了 12 代酷睿处理器之中。不过 12 代酷睿处理器并非是英特尔第一款采用性能混合架构设计的 CPU ,过去 Intel 演示了 Lakefield 处理器,不过更多的还是以试水为主,市面上也难以见到这款处理器。可以说 12 代酷睿处理器是第一款采用性能混合架构的量产处理器。

对于英特尔来说,仅仅是性能混合架构的称呼显然不能完整阐述这两颗核心,事实上它们除了在性能上有所不同之外,在功能上同样有所区别。英特尔将大核心称之为 “性能核心”或者称 P 核心,采用的是 Golden Cove 架构,支持 AVX 512 指令集以及 DLBoost 深度学习等功能,并且还支持超线程功能,最高可以达到 8 核 16 线程。而小核心称之为“效能核心”或者称为 E 核心,基于 Gracemont 架构,最高支持 8 核 8 线程,并不支持包括 AVX 512 在内的各种功能。也就是说 12 代酷睿处理器最高拥有 16 核心 24 线程的规格。

首先我们先来看下基于Golden Cove架构下的P核,P核基于11代酷睿处理器改进而来,除了架构进行了改良之外,对于CPU的基础运算进行了大量的革新,这种设计理念未来将会影响到Intel今后的处理器设计思路。

相比较 11 代酷睿处理器, P 核的解码器从过去的 4 个升级到了 6 个, 6µop 缓存增至 8µop ,分配由 5 路增至 6 路,而物理寄存器也扩大了不少,重排序缓冲区提升至 512 条目。同时英特尔还大幅提升了 12 代酷睿处理器的分支预测准确度,这样子可以降低一级的时延,并且提升了二级的预测带宽。而且 P 核还搭载了英特尔高级矩形扩展,内置了下一代的 AI 加速技术,可用于学习推理以及训练,让 CPU 的数学运算更加强劲。

对于消费者来说,这些改进或许十分地陌生,英特尔也给出了 P 核的具体性能提升,相比较 11 代酷睿处理器, P 核的平均 IPC 提升了 19% ,换句话说就是在同频下性能提升 19% ,考虑到更加先进的工艺带来的频率提升,实际的单线程提升将会高于 19% ,这个提升幅度对于游戏玩家来说显然更有益处,那就是单线程性能的提升带来的结果就是游戏帧率的提升。

Intel 的 P 核性能还是相当给力,除了 P 核之外, 12 代酷睿处理器还首次搭载了小核心的 E 核。 E 核实际上基于的是 Atom 家族,采用 Gracemont 架构,这是一款为低功耗设备所打造的处理器,而这一次也是其首次来到主流处理器之中。与 P 核相比, E 核在面积上就小了很多,比如说一颗 P 核的面积可以塞下四颗 E 核的面积,同时四颗 E 核共享 4MB 的二级缓存。

尽管是 Atom 家族,但是过去几年英特尔也在 Atom 家族中下了苦功夫。比如说和 Skylake 相比, Gracemont 核心的延迟性能比 Skylake 提升 40% ,同性能下的功耗比降低 40% ,而数据吞吐峰值量更可以提升 80% 。英特尔也称小核心设计可以在有限的芯片空间内,实现多核任务负载,换句话说就是降低 CPU 的功耗。需要注意的是,英特尔所说的小核心性能对比指的是延迟性能以及数据吞吐量这种,并不是 CPU 的绝对性能,至于 Gracemont 核心的绝对性能能够达到怎样的水平,我们还是需要等到 12 代酷睿处理器正式发布之后才能知晓。

尽管 P 核与 E 核的设计对于平衡性能与功耗大有益处,但是如何让 CPU 的资源进行合理的调配却大有学问,在 X86 处理器进入到性能混合架构时代之前, ARM 处理器早已进入了混合架构设计,而目前的旗舰处理器甚至已经进入到三丛集时代,然而实际效果相信大家也看到了,手机处理器中翻车的可不在少数,如何能够完美调度 E 核与 P 核,是英特尔的工程师们需要解决的一个棘手的问题。

对此英特尔发明了一项叫做“Thread Director”或者说线程调度器的设计,来调配P核与E核之间的计算资源。首先英特尔在CPU中嵌入了一个微型控制器,这个控制器用来监视每个线程的计算负载与参数,包括延迟、指令类型等,随后英特尔将会把这些线程的参数告知微软Windows 11中的系统调度器,由Win11来决定哪款进程适合P核,又有哪款进程适合E核,英特尔称Thread Director最快只要30微妙就可以确定线程状态,这可比传统的系统调度器快得多,这项技术在移动端领域尤其重要。

从文章之中大家也发现了,想要让Thread Director发挥最佳的作用,采用的系统自然是微软Win11系统,不过即使是Win11系统,目前微软与英特尔之间还需要更多时间去磨合,让CPU的调度更加准确,至于Win10系统,英特尔表示现在还在初步的调试,所花费的时间也就更高,从英特尔的表态来看,还是建议Win10系统的用户升级Win11系统。

英特尔在架构日上也公布了三款不同类型的 12 代酷睿处理器,除了桌面版之外也包括移动标压处理器与低压处理器,它们三款的 Gracemont 核心最高均为八个,桌面版采用 LGA 1700 接口,而移动标压处理器则是 6+8 架构, 14 核 20 线程,至于超低压处理器,则是 2+8 架构, 10 核 12 线程,移动版处理器在 GPU 上最高采用 96EU 单元,图形性能还是值得肯定的。

除了上述主要的架构介绍之外, 12 代酷睿处理器也支持包括 DDR5-4800 、 DDR4-3200 、 LPDDR5-5200 、 LPDDR4X-4266 等多种内存制式,让用户正式进入 DDR5 内存时代,此外 12 代酷睿处理器也将原生支持 PCIe 5.0 ,带来更为充裕的带宽。只不过 PCIe 5.0 对于目前的存储设备以及显卡来说远远过剩,算是锦上添花的功能。同时 12 代酷睿处理器拥有三种不同的高速通道,包括 Compute Fabric 、 Memory Fabric 以及 I/O Fabric ,三者带宽分别是 1TB/S , 204GB/S 以及 64GB/S ,充裕的带宽显然大大降低了处理器之间的传输延迟。

除了 12 代酷睿处理器之外,英特尔也在 2021 架构日上介绍了 DG2 架构 GPU ,当然现在英特尔将采用该架构的显卡称之为 Intel Arc 显卡,中文名为英特尔锐炫。与 DG1 相比,英特尔锐炫显卡专门为游戏发烧友打造,预计第一批产品将会在 2022 年第一季度和大家正式见面,届时除了 NV 和 AMD 之外,游戏显卡终于来了第三位选手。

英特尔在过去推出的各类 GPU 中,都采用了“执行单元”,而到了 DG2 架构中,则变成了全新的 Xe 内核,从命名就可以看到,英特尔对 Xe 架构显卡进行了重新设计。从架构图来看, DG2 显卡类似于 NVIDIA 的显卡,每个 Xe 内核中,包含着 16 个矢量引擎,以及 16 个矩阵数学引擎,这些引擎用来进行 FP32 、 FP16 以及 INT8 的计算,也就是传统的单精度以及 AI 计算。除了 Xe 内核之外, Intel 也介绍了图形单元簇,将其称之为渲染切片,这是专门为图形处理所搭载的架构,包括四个 Xe 内核以及为 3D 渲染所打造的计算单元,比如说光追单元,纹理单元、几何前端,能够支持 DX12U 的各种特征以及实时光线追踪,同时也将支持类似于 DLSS 的 XeSS 功能。

XeSS使用深度学习来合成非常接近原生高分辨率渲染质量的图像,在实际演示中,基于XeSS技术的虚幻5引擎的4K渲染图像与原生4K相比几乎不变,体现在游戏上就是帧率的增加。

而在纯算力上, Intel 锐炫显卡的频率提升幅度为 50% ,而且每瓦性能提升幅度也达到了 50% ,从而带来更高的算力。为了让英特尔的这款显卡能够发挥最出色的性能,英特尔也选择了台积电的 6nm 工艺,同时在驱动程序上,英特尔也和诸多游戏开发者一起,对 Xe 架构进行不断地优化,目前该项工作已经有了初步的成效,在密集型图形游戏之中,吞吐量提升 15% ,最高可以达到 80% ,从而让游戏加载时间降低了 25% 。当然距离显卡的正式发布还有近半年的时间,未来英特尔也将不断地对显卡进行改良,让其更加符合游戏玩家的期盼。

当然除了这两个大家最为关注的硬件之外,英特尔也在本次架构会上介绍了面向数据中心的Sapphire Rapids至强处理器与面向超算的Xe HPC和Ponte Vecchio。其中Sapphire Rapids基于Intel 7制程工艺技术,支持加速器接口架构指令集、高级矩阵扩展,以及数据流加速器,能够提供更高的整体工作负载性能,在CPU、内存和缓存以及所有附加的内存、存储和网络设备之间移动数据。当然作为面向数据中心的新一代处理器,Sapphire Rapids通过先进的内存和下一代I/O,包括PCIe 5.0、CXL 1.1、DDR5和HBM技术,来推动行业技术转型。

英特尔在之前表示 Xe 架构的 GPU 是一个大家族,除了面向发烧级玩家的 Arc 显卡之外,也有针对超算推出的采用 Xe HPC 架构的 Ponte Vecchio 。 Ponte Vecchio 由多个复杂的单元构成,通过嵌入式多芯片互连桥接进行封装,实现了设备之间的低功耗与高速的连接。

英特尔表示在 Ponte Vecchio 中,每一个单元均有 8 个 Xe 内核,提供 4MB 的一级缓存,基于台积电最先进的 5nm 制程工艺,目前 Ponte Vecchio 芯片还处于早期的 A0 阶段,不过先进的工艺以及豪华的参数已经可以让其实现 45T 的 FP32 吞吐量,内存带宽达到了 5TBps ,连接带宽也达到了 2TBps ,英特尔称通过训练,目前 A0 芯片已经可以实现每秒 43000 张图像的识别,达到了行业领先的水准。毫无疑问 Ponte Vecchio 的出现让 NVIDIA Tesla 计算卡面临巨大的挑战,同时也可以让整个超算行业得到进一步的发展。

除了上述这些硬件产品之外,英特尔也介绍了oneAPI,一个开放、规范、跨架构和跨厂商的统一软件栈,让开发者能够摆脱专有语言和编程模型的束缚。未来也将有越来越多的开发者采用英特尔的oneAPI进行开发和优化,从而提升开发者的实际生产能力。

在本次的架构日上,英特尔为消费者以及企业用户带来了海量的架构说明,可以说是干货十足,尤其是12代酷睿处理器,对于现在的消费级市场来说无疑是一针强心剂,让英特尔能够在日益激烈的CPU市场中占领脚跟。事实上对于X86架构的处理器来说,性能核与性能核的设计无疑是一个全新的领域,未来该设计是否成功,一切都是未知数,而英特尔作为半导体领域的领导者,勇敢地跨出了这一步,显然还是有做大哥的担当。我们也发现,想要让英特尔新一代的产品发挥最出色的作用,毫无疑问软件厂商需要跟上,接下来大家就应该期待微软为消费者带来一套令人满意的Win11系统了。

权健事件最新消息 http://www.xinzhiliao.com/sj/dongji/33817.html
免责声明:本站所有信息均搜集自互联网,并不代表本站观点,本站不对其真实合法性负责。如有信息侵犯了您的权益,请告知,本站将立刻处理。联系QQ:1640731186