能耗显著降低,性能同步提升!酷睿Ultra 200系评测
盼望着,盼望着,下一代酷睿来了。自从12代酷睿Alder Lake平台引入CPU异构以来,无论是玩家、发烧友还是媒体与行业都在思考英特尔将如何通过技术革新进一步改变PC行业,而随着ChatGPT与Stable Diffusion引领的LLM/AI浪潮,AIPC这一概念也再一次被人们广泛讨论。作为计算领域的巨头,英特尔在两代主攻低功耗场景的酷睿Ultra处理器之后,第一次将AIPC向高性能领域进军,推出了第二代酷睿Ultra系列处理器,代号Arrow Lake。我们这次拿到了Arrow Lake的两款首发CPU,下面就来看看这个新平台到底能力几何吧。
新接口登场!
酷睿Ultra 200系列在外观上的最大特征就是采用了全新的LGA 1851接口,这也意味着用户将需要更换到最新的Intel 800系芯片组主板来使用新CPU。
从这组Arrow Lake与Raptor Lake Refresh处理器的对比图上我们可以看到,两代处理器的IHS设计可以说是十分相似,除了上面的文字不同之外基本没有区别。这意味着,LGA 1851平台的用户可以继续使用现有的LGA 1700平台散热器,无需额外购置,怎么说都是一件好事。
而翻到背面,LGA 1851接口最大的特色就是更多的触点,这次触点的排布已经相当接近物理边缘,搭配只有一侧的缺口,在防呆设计上更进一步。
测试平台
由于我们拿到这套全新的平台较早,本次我们也是开足马力,使用如图所示的配置尽量完整地展示Intel最新处理器平台的强大性能表现与战斗力。由于Arrow Lake是一个相对更新的CPU平台,我们这次采用了最新的Windows 11 24H2版本操作系统进行理论性能、游戏性能与工作站性能测试。需要注意的是,由于Windows 11 24H2强制开启了基于虚拟化的安全机制与内存完整性两项严重影响性能表现的安全性功能,我们在测试前手动关闭了它们。除此之外,在核显测试环节,我们还引入了与这两颗CPU搭载同样架构核显的Intel Arc A770 16GB Limited Edition显卡进行对比测试。
我们这次搭配酷睿Ultra 200系处理器使用的是来自微星的MEG Z890 ACE主板。作为微星Intel主板产品线中的旗舰产品,今年的 ACE 的尺寸从去年的 EATX 调整回了标准的 ATX 尺寸,显著提升了机箱兼容性,同时仍然满载旗舰规格用料,并且完整利用了酷睿Ultra 200系芯片的各类新特性,可以说是展示这个新平台的不二之选了。
而在搭配i9 14900K测试的LGA 1700平台主板上,我们也选择了同样来自微星的MPG Z790 EDGE TI MAX WIFI刀锋钛主板,具体的评测可以看这篇文章。这款极具性价比的高端主板搭载了18项高规格供电、最高7800MT/s XMP的DDR5内存插槽与PCIe 5.0规格的拓展位,能够完整发挥酷睿i9 14900K在Intel默认预设下的性能表现。
P核E核全面升级
作为桌面端的第一代酷睿Ultra处理器平台,Arrow Lake在核心规模和型号上都有了不小的改进,其中最显著的就是彻底剔除了超线程功能。这项功能在2002年的Pentium 4 Northwood平台上与用户第一次见面,随后在Atom家族以及脱胎该家族产生的mont系能效核心之外的所有消费级核心中都有出现,仅仅是根据定位在部分SKU中关闭而已。而在Arrow Lake平台上,超线程功能则是被硬件去除,彻底不见踪迹。
考虑到超线程技术仅仅是在逻辑上允许操作系统调用更多的CPU核心,对于普通用户的日常工作应用场景中带来的提升本就有限,加之超线程技术对如今更复杂的CPU线程调度机制带来的负面影响,在本身自Alder Lake以来桌面处理器核心数量已经爆增的前提下移除这一机制对实际反映到应用中的性能表现带来的整体影响很难称得上负面。甚至,从我们接下来的测试中你可以看到,在常见的消费者应用中,新一代酷睿Ultra平台的性能相比14900K相比有显著的提升。当然了,对于负载并行度更高、能够有效利用超线程技术优势的工作站/服务器应用平台开发的Xeon平台而言,超线程功能仍然是保持开启的。
本次新平台的P核和E核架构也双双得到提升,与Lunar Lake一样分别采用了Lion Cove P核与Skymont E核。这套核心配装在Lunar Lake上已经凸显了它在能耗比上的优势,来到核心规模与功耗限制都更为宽松的桌面端平台也自然生龙活虎,这一点可以参考我们接下来进行的测试。
除了核心架构之外,本次英特尔酷睿Ultra 200系平台在缓存层面改进也颇为激进。除了全CPU核心共享的最高36MB L3 Cache与每个能效核集群的4MB L2 Cache之外,本次每个性能核心的L2 Cache被拉到了3MB,这意味着在Ultra 9 285V处理器上,光是全系统的L2 Cache就已经来到了32MB,这甚至已经超过了友商一些处理器的全package缓存容量,在高缓存敏感的游戏应用中尤其能够带来相当可观的性能提升。
除了CPU微架构之外,本次英特尔酷睿Ultra 200系平台也首次在传统桌面处理器端引入了先进的Foveros 3D封装工艺,能够将采用不同制程工艺制造的芯片融为一体。与友商将多个CPU模块与IO模块通过PCB板封装在一个产品中的方案不同,Foveros 3D除了能够显著提升最终成品的良品率之外,该工艺也允许产品经理因地制宜地针对不同类型的负载定义不同的芯片架构、降低互访延迟,并提升处理器平台整体的性能表现。除了企业级的Sapphire Rapids Xeon平台之外,Foveros 3D封装技术也在轻薄本中大放异彩的Meteor Lake/Lunar Lake两代酷睿Ultra平台中发光发热。同时,在市场层面上,Foveros 3D封装技术也能够显著提升新技术的交付效率,让Lion Cove与Skymont两种核心在移动端亮相一个月后就在桌面端粉墨登场。而在本次发布的英特尔酷睿Ultra 200系桌面平台上,我们看到整个CPU封装包括计算模块、IO模块、GPU模块和SOC模块,通过基础模块互相连接,还有一个填充模块用于平衡受力。
同时,在频率控制机制,以及由此衍生的超频玩法上,本次Arrow Lake平台也带来了大量的改进。不仅核心时钟能够以16.67MHz的步进进行调频,还能够以模块为基本单位进行精密调频。搭配电源管理、软件生态等方面的其他提升,能够让超频爱好者们冲击更高频率。
当然了,理论是理论,实践是实践。我们在Intel Default Settings – Extreme预设下进行了30分钟的FPU烤机测试,对比三颗处理器在四个不同模式下的频率与功耗表现。可以看到,Ultra 5 245K与Ultra 9 285K的P核全核频率均已突破5GHz,E核频率也突破了4.5GHz,然而功耗控制表现却更为出色。同时,我们看到,关闭超线程后的i9 14900K在该测试中只得到了8W的功耗降低,为这一新平台迎来了第一场开门红。
而在性能上,我们在3DMark CPU Profile中针对三颗处理器的游戏性能进行考核。可以看到,除了真的因为规模不够高导致Ultra 5 245K在全线程测试中败下阵来之外,在每个测试项目里酷睿Ultra 200系平台的得分都显著高于老旧的酷睿i9 14900K,表现极为出色。
而在面向实际游戏应用的五大金刚中,我们也看到了类似的数据表现。
而在CPU-Z套件中,我们看到i9 14900K在极限单核性能上仍然有一定的优势,这归功于它更高的频率标定,这一点在后面的测试中也能看到。
再见了,所有的DDR4
在内存控制器方面,Arrow Lake平台彻底舍弃了对DDR4生态的支持,为DDR4这一从2014年Haswell-E发布以来一直在市场上呼风唤雨的内存生态在主流电脑市场的生命周期正式画上了终止符。当然,如今的DDR5内存随着各家供应商产量爬坡,在价格方面已经十分亲民,仅针对DDR5开发也能够有效简化内存控制器设计,提供更可靠且高性能的产品,这也是历史发展的必然趋势。总之,Intel针对Arrow Lake平台提供了6400MT的官方标定,还支持CUDIMM、CSODIMM和ECC等先进技术,这意味着对于很大一部分用户,尤其是限制超频能力的品牌整机用户来说,使用JEDEC频率标准条也能够获得相当可观的内存性能,在行业内遥遥领先。同时,本次内存控制器规格的升级也意味着即使用户将内存频率推高到8000MT,系统也仍然能够在Gear 2模式下运作,甚至Intel的工作人员在媒体简报会上将这一频点称作“甜点”,并表示英特尔酷睿Ultra 200系平台还能够进一步压榨内存频率。可以说,对于内存超频爱好者来说,这套平台能够带来相当有趣的使用体验。
当然,我们测试使用的是仍然一对来自影驰的DDR5 6800MT CL36的套条,这也是目前相当主流的内存频点之一。在AIDA64的内缓存性能测试中,我们能够对系统的内缓存性能进行考察。在同样的6800C36的频率下, 我们测试了三个平台的内存性能,酷睿Ultra 200系的带宽显著高于上一代Raptor Lake处理器,只是延迟方面略逊一筹。
更多的PCIe
当代计算平台早就脱离以CPU为绝对主角、各类AIC卡仅作为辅助的传统范式,且基于PCIe总线的NVMe固态硬盘、高速网络等外围部件在主流消费者产品中的普及也对处理器平台的PCIe拓展能力提出了相当的要求。尽管Intel早在11代Rocket Lake平台就已经将CPU直连的PCIe通道数提升到20条PCIe 4.0总线,支持一条M.2固态硬盘与一张满血PCIe x16显卡的直连,但在这一代Arrow Lake处理器上,Intel还额外添加了四条直连的PCIe 5.0总线,加上PCH提供的通道,进一步推高了系统的拓展能力。
更多的PCIe通道允许设备制造商提供更多更灵活的主板方案,为消费者带来更多样的选择。例如,我们这次使用的MSI MEG Z890 ACE主板就同时支持两条PCIe 5.0*8规格的拓展卡 两条满速x4 M.2硬盘同时直连CPU,甚至其中一条硬盘还是5.0*4的超大带宽,这在之前的主板中几乎不敢想象。当然了,考虑到PCIe 5.0*8的规格即使搭配RTX 4090这样的旗舰级GPU都不会造成带宽瓶颈,这样的拆分对于一块面向游戏玩家的主板来说相当合理。而对于其他部署方式和需求,厂商也同样可以利用这些通道提供例如多GPU、超高速以太网、磁盘阵列卡等设备,有效利用直连CPU通道的更低延迟实现更灵活且多样的最终产品方案。
炼金术士!
尽管面向低功耗移动平台的Lunar Lake所搭载的第二代Intel Xe Battlemage核显凭借着第二代Xe核心本身带来的强大性能与Lunar Lake平台革命性设计带来的优秀能耗表现令所有人赞不绝口,但Arrow Lake平台仍然搭载基于上一代Alchemist Xe-LPG GPU的核显方案。当然了,作为真的自掏腰包购买了A770 Limited Edition并真的在自己PC中使用这张GPU作为主力的用户而言,笔者对Alchemist这个Intel在高性能GPU领域暌违30年的首秀还是十分满意的,尤其是这代GPU架构所带来的对各类视频格式的硬件编解码能力也能够为多媒体生产力用户与核显用户带来十分显著的提升。
在架构上,英特尔酷睿Ultra 200系平台的Xe GPU基于Xe-LPG图形架构打造,最高支持4组Xe核心,尽管规模上远不及移动端平台,但考虑到这一平台一般会搭配独立显卡,其支持DP4a AI加速、Xe矢量引擎和媒体引擎的特性与能实现的最高8TOPS的AI算力就显得极为出彩了。例如,这颗GPU支持索尼最新的8K XABC编解码器,能够为生产超高清内容的工作者带来相当可观的性能提升。
总之,我们来看看性能。由于时间有限,我们这次就只测试最经典的3Dmark图形测试。在3Dmark面向低性能GPU的五个测试套件中,这两颗核显跑出了相当可观的成绩,无论是对比上一代i9 14900K的UHD 770核显还是友商在对应定位机种中部署的Radeon 610M核显都有显著的性能提升。尽管与如Lunar Lake这样移动优先平台中搭载的大规模核显仍然无法相比,但支持最高4个显示器的特性也仍然让人刮目相看。
台式机也有NPU
近年来AI PC这一概念可以说是一大热门。通过在SoC中加入NPU堆栈将一些AI应用本地化部署,不仅能够显著提升系统的整体能耗表现,还能够为OEM与ISV提供可靠的开发平台,甚至微软也推出了Copliot PC标准来推进AIPC的普及。无论是Intel自家的Meteor Lake和Lunar Lake还是友商以Phoenix为代表的一票AI PC平台都搭载了相当高性能的NPU,而本次Arrow Lake则是市场上第一款搭载了NPU的x86 MSDT平台,搭配iGPU与CPU的算例,最高能够实现36TOPS的平台算力。再搭配上一张如A770这样的高性能独立显卡,整体的AI算力就十分可观了。
而在如90年代GPU市场一样百花齐放的NPU市场中,Intel的NPU产品凭借着更完善的软件工具栈以及oneAPI这样的统一开发环境能够让开发者和用户在不同类型的设备上使用同一套代码栈,显著提升了AI算力实际落地的效率。我们使用Geekbench AI对酷睿Ultra 200系处理器的AI性能进行了测试,可以看到第二代酷睿Ultra平台的AI算力确实相当可观,甚至与满血的A770 16GB LE都不相上下,对AI应用,尤其是能够有效利用CPU GPU NPU的异构AI应用而言,第二代酷睿Ultra处理器几乎就等于另一张A770,而Intel提供的统一开发技术栈也能够助力ISV有效利用算力,可以说是走在一条正向循环的道路上了。
游戏性能
在游戏测试环节,我们使用RTX 4080 SUPER显卡,在1080P最低画质下进行游戏性能测试以尽可能给CPU上压力。
首先是CPU极敏感的CS2。目前,CS2可以通过创意工坊提供的fps_benchmark地图进行 性能测试,而在这个CPU/内存敏感的游戏中,我们可以看到Ultra 9 285K的性能表现与i9 14900K不相上下,在接近700帧的平均帧下仅仅相差两帧,但功耗却实打实地降低了100W,表现相当惊艳。
而在最终幻想14测试中,我们在最低画质、100% FSR、关闭可变分辨率,并开启了运动物理特效进行测试。在这个游戏中,酷睿Ultra 200系平台可以说是全面胜利,无论是平均帧还是功耗表现都有显著优势,表现相当出色。
在赛博朋克2077这款现代3A游戏中,Ultra 9 285K在纯游戏性能上就略逊一筹,但是功耗上的优势却依然显著。在这里表现更为出色的反而是小号的Ultra 5 245K,80W不到的功耗表现却有与大哥相近的游戏性能,令人赞叹。
而在黑神话悟空这款基于虚幻5开发的、在技术栈上极为先进的大作上,我们也看到了类似的性能表现,只是两款Ultra处理器的功耗表现之间差距仅有16W,比2077的数据更低。
F1 2024这款高性能负载的赛车游戏中酷睿Ultra 5 245K第一次显现出败项,但说是败项其实也有350帧的平均帧和243帧的1% Low帧。考虑到F1 2024这款游戏强制基于光线追踪运行,加之在这个性能下U5只耗费了54W功率,这样的表现也确实十分优秀。
经典的CPU性能测试游戏杀出重围:人类分裂又是一个酷睿Ultra 200系占据绝对优势的战场,无话可说,全面薄纱。同时,i9的数据也可以看到,这款游戏似乎对超线程技术天生不友好,我们的i9 14900K在关闭超线程之后性能表现反而有一定的提升。
另一款经典的性能测试游戏古墓丽影:暗影里面,我们也看到了同样的趋势。考虑到这两款游戏都是针对第八世代主机开发的老游戏,对于Alder Lake以来的异构计算处理器,尤其是Arrow Lake这样还关闭超线程技术的处理器支持不佳也是十分合理,只是尽管极限性能上略有败绩,但先进工艺加持下的酷睿Ultra 200系平台在能耗比上仍然一如既往的出色,在绝大多数游戏中的功耗表现甚至能够直接搬进游戏本,不得不让人期待接下来发布的ARL-HX高性能移动平台的性能表现了。
工作站性能
如果说Arrow Lake平台的游戏性能能被称为四两拨千斤,用巧劲立于当下Intel平台的最高点,那么在纯粹依靠多核心算力的生产力应用中,它就毋庸置疑的是全场目光最靓的那个崽。我们首先通过轻量级的UL Solution Procyon测试套件的办公室生产力基准测试开始,这项测试通过MS Office套件能够有效地测试系统在高强度的Office办公场景下的性能表现。
Cinebench系列套件基于Cinema4D渲染器构建,是考核CPU在3D渲染工况下性能表现的良好工具。我们测试了四个平台在Cinebench R15、R20、R23以及最新的2024版本中的性能表现。可以看到,Cinebench套件的成绩也延续了之前测试的3DMark CPU Profile中的趋势,除了Ultra 5 245K因为规模原因在多核性能上得分逊于i9之外,酷睿Ultra 200系平台在该项目中仍然占据绝对优势。
性能需求更高的Blender 3D渲染套件中,我们在三个预设场景下也同样看到了类似的性能提升,Ultra 9 285K相比i9 14900K的提升幅度高达30%,对于3D渲染工作者来说优势十分显著。
技术更激进的V-Ray 6渲染器中,酷睿Ultra 9 285K的提升也来到了24.9%,提升幅度同样可观。
当然,最后是大招,SPECworkstation套件。这项重工业生产力测试套件可以全方位考察系统在复杂的工作站应用下的性能表现,为用户提供全面的性能结论。可以看到,在几乎所有项目中,代表酷睿Ultra 200系平台的蓝色都一柱擎天,仅仅在Octave渲染器的测试中以1.98分的成绩略逊i9 14900K的2.17分,表现堪称无敌。
总结
从我们测试的数据上可以看出,酷睿Ultra 200系平台确实称得上是一套完整的发烧友级解决方案。即使不考虑更先进的3D封装工艺、拓展性能上的全面提升、高性能的Xe核显与NPU,只关注纯粹的CPU性能,无论是在各类生产力应用中无与伦比的多核心性能表现还是在游戏中显著更低的功耗都足以让笔者对这下一代的酷睿平台十分满意。而加上前面提到的各类技术革新之后,这个平台更是能让我们一睹英特尔眼中的未来计算机体系。同时,酷睿Ultra 200系平台相当惊艳的能耗表现,搭配目前坊间对各家下一代显卡的传言,让笔者同时也对下一代HX移动平台充满期待。
0