AMD锐龙线X首测稳坐HEDT平台头把交椅

数码新闻 2019-11-2894未知admin

　　AMD今年的CPU产品线路图上的东西基本都完成了，年初发表了新的移动版锐龙处理器，7月发布了基于Zen 2架构的第三代锐龙处理器，8月份推出了代号为Rome的第二代EPYC处理器，而今年AMD在CPU线路图上最后的一步就是第三代锐龙线程撕裂者处理器了。

　　锐龙线程撕裂者处理器是AMD针对HEDT和工作站所准备的，直接竞争对手是Intel的Core X系列处理器，不过呢，对手的核心数量已经维持在最多18核很多年，而AMD这边锐龙线程撕裂者的核心数量一直是比较激进的，第一代一上来就是16核，第二代直接翻倍到32核，弄得Intel后来把28核的Xeon W-3175X推向消费市场，现在第三代撕裂者来了，初上市的只有24核和32核的产品，以后会有更多的核心，而早几个小时前的Intel新一代Cascade Lake-X处理器，最多也只是18核，但价格和上代发布时相比完全是腰斩，这完全得益于AMD锐龙线程撕裂者处理器给对手施加的巨大压力。

　　其实AMD推出16核锐龙9 3950X处理器的时候我是有点惊讶的，因为这已经相当把HEDT级别的处理器投放到主流平台，它的部分性能确实可以媲美Intel的Core i9-9980XE，他们就不怕影响到自己的锐龙线程撕裂者的销量吗？不过X570平台和X399平台在扩展能力上还是有很明显的差别的，前者CPU和芯片组加起来也就36条可用的PCI-E通道，后者光CPU就能提供60条可用的PCI-E了，新的TRX40平台更可提供更多的PCI-E，而且第三代锐龙线核的产品了，核心数量直接从24起步。

　　首批发布的第三代锐龙线程撕裂者处理器只有两颗包括32核和24核的两款产品，开会的时候起初以为AMD这代线程撕裂在最大核心数会和上代维持一样，不过发布会最后AMD突然宣布会有超过32核的产品，明年会推出64核的锐龙Threadripper 3990X，从它的名字上来看，48核的锐龙Threadripper 3980X应该是会存在的。

　　第三代锐龙线程撕裂者再一次更换了外包装，和前两代相比这次包装小巧了许多，用的也不再是泡沫外包装，而是相对来说更环保的厚纸皮，而内包装则变得更华丽了，前两代都是用橙黑色的盒子装着处理器，现在处理器锁在一个纪念碑状的容器里面，外部有个透明的亚克力罩子，拿去罩子后要拉开侧面的锁才能把处理器拿出来。六角形螺丝刀、CPU扣具、一大一小两张Ryzen Threadripper贴纸位于包装底部的小盒子里。

　　第三代锐龙线程撕裂者虽然换了接口，但是接口的外形和针脚位置、数量和之前是没有差别的，只是针脚定义有所不同，所以锐龙Threadripper 3970X处理器看起来和前两代产品没有啥差别，CPU外面依然有橙色的安装滑轨。

　　第三代锐龙线程撕裂者的变化

　　锐龙线程撕裂者诞生之初它就用MCM多芯片封装，第三代锐龙线程撕裂者也一样，但是核心架构从Zen+进化到Zen 2，核心的制程工艺从GF的12nm升级成台积电的7nm，当然IO核心依然是用12nm生产的，使用新的Socket sTRX4接口，虽然接口的外形和针脚数量和之前的Socket TR4是完全一样的，但是针脚的定义不用，并不向下兼容X399主板，只能搭配新的TRX40主板使用。

　　7nm工艺带来的提升

　　Zen 2架构锐龙采用7nm工艺生产，而且代工厂不再是前女友Globalfoundries，而是台积电，而且与上代的12nm只是14nm的改良版不同，台积电的7nm工艺是全新的节点工艺，根据AMD所说7nm工艺实现了两倍的晶体管密度、同性能下功耗降低50%或者同功耗下性能提升25%的变化。

　　而实际上采用7nm工艺的Zen 2架构CCX面积是31mm2，采用12nm的Zen+架构的CCX面积则是44mm2，面积缩小了29%，但别忘了Zen 2每个CCX内的L3缓存翻了一倍，这些缓存是相当之占空间的，在缓存翻倍情况下核心面积也缩小了这么多可见7nm对比起12nm的进步是相当之大的。

　　制程的升级带来的还有能耗比的提升，在同样电压下，采用7nm工艺的产品核心频率会比采用12nm的产品高350MHz，Zen 2架构的第三代锐龙处理器能耗比较Zen+架构第二代锐龙处理器高出75%，比采用14nm++工艺的Intel第九代酷睿处理器高出58%。

　　AMD表示，Zen 2架构是从Zen和Zen+架构发展而来，可以说是后两者的一个延续，但同时也作出了很多创新和改良，最终在运算能力和扩展能力上都有了很大的提升。Zen 2架构与Zen+架构相比，IPC提升了15%，缓存容量翻了一倍，浮点计算能力也翻了倍。

　　Zen 2架构核心仍然维持1个核心支持2个线程的SMT同步多线程设计，但相比前代架构又更大微指令缓存，支持4K指令，L3缓存相比Zen和Zen+架构要直接翻倍，1个核心内部有4个整数单元和2个浮点单元。Zen 2架构采用了新的TAGE分支预测器，将预测错误率大幅降低了30%，使得处理器可以花更少的时间完全前段分派工作，这样就可以很好的提升处理器的计算效率。

　　基础缓存结构

　　Zen 2架构的缓存系统也得到进一步的优化，L1指令缓存从64KB，4-Way调整为32KB，8-Way阵列，L1数据缓存32KB，8-Way阵列，位宽32位，与Zen架构相比L1数据缓存位宽翻倍；L2缓存容量仍然为512KB，8-Way阵列，L1与L2缓存的预读机制都有所改善；L3缓存则为共享的16MB，16-Way阵列，容量比以前翻了一倍。

　　取指令系统的改善包括增加全新的TAGE分支预测器，它会与神经网络预测相辅相成提升预测正确率，分支目标缓冲器也有所变化，在以前的Zen架构中，BTB有三个级别，L0 BTB有16条目，L1 BTB有256条目，L2 BTB有4K条目，到了Zen 2架构，L0 BTB数量与Zen相同，L1 BTB数量翻倍到512条目，L2 BTB则增长了1.75倍到7K条目，也有较大的1K间接目标数组。

　　指令解码系统的改善包括操作缓存优化，翻倍的4K微指令操作缓存，更好的指令融合，通过防止重新编码操作来增加吞吐量。

　　浮点架构上，目前的AMD锐龙、霄龙处理器支持到了AVX2，Zen 2上AMD翻倍了浮点单元位宽，从2x128bit提升到2x256bit，大幅提升执行AVX-256指令的效率，乘法指令延迟也从4周期缩短到了3周期，浮点单元的改动使Zen 2处理器在运行创作类应用时性能大幅提升。

　　整数单元方面，Zen 2的整数调度器从84增加到92，当中包括4个16条目ALU阵列和1个28条目AGU阵列，而每个内核拥有四个整数ALU单元和三个AGU地址生成单元，地址生成单元比之前的Zen架构多了一个，这使得执行引擎更可靠地在内存中的提取数据，同时改善了SMT同步多线程调用ALU单元和AGU单元时的公平性，减少线程之间相互争夺资源。物理寄存器堆从168条目增加到180条目，这样CPU就可以实时访问更多工作数据。

　　读取与存储系统改进

　　Zen 2与Zen+相比，单线%是来自架构优化IPC的提升，另外40%则是来自7nm工艺所带来的频率提升。

　　综合来说，Zen 2架构更接近与是对Zen和Zen+架构原本不完善的地方进行了补完，同时还多个方面都进行了增强，通过增加双倍缓存的方式，增加了指令预测的命中率，加大了内部数据与指令传输的带宽，使核心运行效率可以得到最大化。

　　改良过的MCM架构

　　前两代锐龙线个Zen/Zen+内核封装在一起而成的，核心之间采用25GBps的Infinity Fabric总线互联，这样的架构在服务器的EPYC处理器上是没有问题的，因为它每个核心都启用了自己的内存和PCI-E控制器，但是锐龙线提供内存控制器和PCI-E控制器，于核心1和核心3是没有直接连接内存和PCI-E的，所以Ryzen TR 2970WX/2990WX只能工作在NUMA模式，这核心1/3的通信延迟明显高于核心0/2，所以会限制这两个核心的性能，而且Windows的工作分配没那么智能，如果程序用不到那么多线程，但不幸被分配到那两个核心去处理的话，工作效率会大打折扣。

　　第二代锐龙线程撕裂者四个核心之间的连接方式是这样的

　　而到了Zen 2架构，从消费级的锐龙处理器到服务器的EPYC处理器都采用了MCM封装，但连接方法和之前的EPYC和锐龙线程撕裂者有了很大区别，Zen 2架构中CPU被拆分成CCD计算核心和IOD输入输出核心，CCD核心中只有两个CCD，它只负责计算，而所有的内存、PCI-E、USB、SATA控制器转移到了IOD上，CCD与IOD之间采用第二代Infinity Fabric总线连接，这样延迟虽然会有所增加，但是很好的解决了每个核心之间访问内存和PCI-E时延迟不一的问题，而且凭借CPU内部的大缓存设计以及Zen 2架构种的指令预测机制，延迟的问题其实很大程度上已经得到了解决。

　　第三代锐龙线程撕裂者目前是使用一个IOD连接四个CCD，如果明年48核和64核的产品出来的话就是一个IOD连接八个CCD了，IOD内部有64条PCI-E 4.0控制器、四通道内存控制器和可提供4个USB 3.2 Gen 2接口的USB控制器，单个CCD和IOD之间的通信带宽在FCLK在1600MHz时为51.2GB/s读取和25.6GB/s写入，另外第三代锐龙线程撕裂者的两个最快的CPPC2核心是固定在CCD4上的，大家可以理解为CCD4的核心体质最好。

　　所有的锐龙、锐龙线程撕裂者和EPYC处理器所用的CCD核心都是一样的，均是台积电7nm工艺打造的8核芯片，每个CCD的核心面积是74mm2，内部有39亿个晶体管。但AM4平台的锐龙处理器和EPYC与锐龙线程撕裂者所用的IOD是不同的，锐龙处理器上的IOD只支持双通道内存和最大两个CCD，它采用GF的12nm工艺生产，核心面积则是125mm2，内部有20.9亿个晶体管，而EPYC和锐龙线程撕裂者上的IOD可支持最多8个CCD，还有更多的PCI-E通道，所以芯片的尺寸要大得多，核心面积达到416mm2，晶体管数量更是有83.4亿。

　　虽然第三代锐龙线程撕裂者是直接用了EPYC Rome的IOD，不过并没有完全启用这个IOD的全部功能，毕竟EPYC是支持8通道内存的，而且可提供128条PCI-E通道，现在都只开了一半，而且多路处理器的功能也没了。

　　第三代锐龙线程撕裂者另一个大变化就是搭配的主板换了，现在要使用Socket sTRX4接口的TRX40主板，不再向下兼容X399，而旧的锐龙线程撕裂者处理器也不能用在新的TRX40主板上，因为接口的针脚虽然是一样的，但是针脚定义并不相同，最大的可能性就是新架构的内存和CPU的连接方法不一样了，所以要改针脚定义，此外主板芯片组与处理器之间的连接方式也有变化，这也有可能是原因之一。

　　TRX40主板所用的南桥芯片其实和X570主板上的都是一样的，其实就是锐龙处理器里面的IOD，不过和CPU之间的通信通道增加到了PCI-E 4.0 x8，带宽高达16GB/s，比X570翻了一倍，而此前X399只是用PCI-E 3.0 x4来进行CPU和南桥之间的通信，带宽只有4GB/s，所以这一代CPU和南桥之间的带宽高了许多，大大的降低了通信瓶颈，南桥的扩展能力也大幅增强。

　　而第三代锐龙线程撕裂者处理器本身，一共有64条PCI-E 4.0通道，当中8条用来和南桥通信，也就是可用的有56条，其中48条是通用PCI-E通道，另外也有两组4条PCI-E 4.0是用来连接存储设备的，可做成两个PCI-E 4.0 x4或者4个SATA 6Gbps，不过通常来说主板厂商都会选择把这两组做成M.2接口，此外CPU内部还有个USB控制器，可提供4个USB 3.2 Gen 2接口。

　　我画了个表让大家更好的了解AMD X399、X570和TRX40主板的扩展能力：

　　关于PCI-E 4.0所带来的提升，我们早已做过测试，PCI-E 4.0的SSD在PCI-E 3.0接口上速度只能去到3200MB/s，这也是现在大多数M.2 SSD的极限速度，不过如果使用PCI-E 4.0的线MB/s，写入速度也能到4200MB/s，接口升级后连续读写速度明显快了不少。

　　锐龙Threadripper 3970X的定位是针对内容创作者和工作站为主的，同时也兼顾一定的游戏性能，所以这次我们增加了SPECworkstation这种工作站的测试，而游戏测试的项目和之前相比有所减少。

　　基准性能测试

　　虽然说Core i9-10980XE处理器支持AVX-512，以前的话它会在处理器多媒体项目占不少优势，但是Zen 2架构强化了处理器的浮点运算能力，再加上核心数量的优势，锐龙Threadripper 3970X现在的基础运算性能是完全碾压对手。

　　两个传统的测试，SuperPi跑起来还是Intel的处理器略微强一点，但wPrime这边AMD单线程已经追上了，多线程更是利用核心数量的优势完全碾压。

　　渲染与创作测试

　　核心数众多的锐龙线程撕裂者受到了工作站和渲染农场用户的欢迎，所以渲染和视频制作是这次考察的重点。

　　CINEBench使用MAXON公司针对电影电视行业开发的Cinema 4D特效软件的引擎，该软件被全球工作室和制作公司广泛用于3D内容创作，而CINEBench经常被用来测试对象在进行三维设计时的性能，锐龙Threadripper 3970X在这项测试中单线程得分也比Core i9-10980XE要高，多线程就更是翻了一倍。

　　Blender是一个开源的多平台轻量级全能三维动画制作软件，提供从建模，雕刻，绑定，粒子，动力学，动画，交互，材质，渲染，音频处理，视频剪辑以及运动跟踪，后期合成等等的一系列动画短片制作解决方案。这里使用的是它的独立Benchmark，而Blender的版本号是2.80。这些渲染软件是很能发挥多核的作用的，核心数量越多渲染速度就越快，锐龙Threadripper 3970X只用了一半的时间就把图片渲染好了。

　　POV-Ray是由Persistence OF Vision Development开发小组编写的一款使用光线跟踪绘制三维图像的渲染软件,其主要作用是利用处理器生成含有光线追踪效果的图像帧，软件内置了Benchmark程序，锐龙Threadripper 3970X的渲染速度单线程其实已经比Core i9-10980XE要好了，多线程就领先得更多了。

　　视频制作测试

　　x264以及x265是两个老牌开源编码器，应用相当广泛，这次我们使用了新版本的Benchmark，它能更好的支持AVX 2指令集。x264的测试中锐龙Threadripper 3970X表现正常，但是x265的测试并没有很好的利用上这颗32核的全部核心，所以领先的幅度不多。

　　Adobe Premiere Pro是一款常用的视频编辑软件，目前这款软件广泛应用于广告制作和电视节目制作中，有较好的兼容性，且可以与Adobe公司推出的其他软件相互协作。测试方法是把一些原本做好的8K的视频项目并使用YouTube 4K的格式进行导出。锐龙Threadripper 3970X凭借自己超多的核心数量优势依然保持着领先。

　　工作站测试

　　我们就直接使用SPEC组织的工作站测试来考验这两套平台的工作站性能了，各项测试都只取CPU得分，基本上锐龙Threadripper 3970X全面领先Core i9-10980XE，在生命科学和金融服务这两项里领先幅度特别大。

　　游戏性能测试

　　说真的游戏性能向来都不是这两个处理器的重点，但是不排除有个人创作者拿自己的设备顺便玩下游戏的情况，所以这里就顺便跑一下。

　　现在基本没有游戏能完全发挥18核的Core i9-10980XE的价值，更别提32核的锐龙Threadripper 3970X了，他们两个的游戏性能其实是比较接近的，基本没啥区别，不过锐龙Threadripper还有个Game Mode能提升游戏性能，只不过拿到新版RyzenMaster软件的时间比较晚，这次没有开启测试。

　　温度与功耗测试

　　首先要说下的是这里测的是平台功耗，锐龙Threadripper 3970X是个32核，所以它的功耗是不会低到哪去的，平台待机功耗138W，而满载功耗高达421W，比Core i9-10980XE的要高出134W，但分摊到每个核心的话其实锐龙Threadripper 3970X的每核心功耗是要比Core i9-10980XE更低的，这也是7nm工艺所带来的能耗比优势。

　　超频测试

　　先来说说用RyzenMaster自动超频的情况，如果单纯只用PBO的线GHz，和默认是没有区别的。使用自动OC +200那档的话，单核最大加速频率能到4.6GHz，全核最大加速频4.15GHz，运行FPU时频为3.7到3.8GHz，稍微比默认高一点，但是没有太大区别。

　　至于手动超频嘛……确实有点难搞，如果想过稳定性测试的话，建议还是别弄了，因为这32核的温度实在是太高了，CPU本身是可以超到4.25GHz的，但是散热器根本就压不住，我们已经用上360的一体式水冷了，想过AIDA 64 FPU稳定性测试的线V，再稍微高一点温度也会控制不住。

　　如果只是单纯想跑分的线GHz也是可以的，电压需要加到1.328V，此时通过R20测试得分为18408，比默认状态提升了8.3%，也是一个不错的提升。

　　当然我觉得这个锐龙Threadripper 3970X其实能继续往上超的，但是完全被温度所限制住了，不过说线核能全核跑这个频率已经不错了。

　　这只是TRX40平台的开胃菜

　　今年的锐龙Threadripper 3970X对Core i9-10980XE其实就是去年锐龙Threadripper 2990WX对Core i9-9980XE的翻版，只不过Intel那边的Cascade Lake-X是在Skylake-X的基础上的小修小改，但AMD这边从Zen+进化到Zen 2完全是质的飞跃，把各种控制器移到外部的IOD上之后，锐龙线程撕裂者得以让每个核心获得相等的内存延迟，不会再像上一代那样有两个核心内存延迟特别大，导致那两个核心效率低下，Zen 2架构其实更适合这种超多核的处理器，能让每个CCD都能发挥出全部性能，也有利于核心数量的堆叠，从天梯榜就可以看到锐龙Threadripper 3970X的性能其实比上代的锐龙Threadripper 2990WX高出不少的，AMD这边的性能优势在进一步扩大。

　　当然了AMD这种多芯片MCM结构CPU还是存在CCD之间通信延迟较大的问题，它们之间要走IF总线经过IOD才能交换数据，想想都知道延迟有多大，Intel这种单个大核心由于是芯片内部通信，核心与核心之间通信延迟自然低得多，不过呢，单个大核心是有极限的，毕竟核心堆得越多，芯片面积就越大，就会面临良品率低的问题，所以Intel也打算弄MCM多核了，56核的Cascade Lake-AP就是由两个28核的Cascade Lake-SP所组成的，不过目前这东西还只存在于纸面上，我怀疑等Intel弄得出来AMD Zen 3都要完工了。

　　目前来说锐龙Threadripper 3970X是现在HEDT平台上最强的处理器，在他之下是AMD上一代旗舰锐龙Threadripper 2990WX，Intel那边酷睿X系列处理器最多也只有18核，在多线核的处理器对抗，锐龙Threadripper 3970X在测试中它表现出了强大的运算能力，它应该会很受工作站的欢迎，强劲的并行计算能力可以大幅度提升生产力，渲染和视频制作的表现都比其他处理器要好，可以为内容创作者节约大量时间。

　　其实在去年AMD推出第二代锐龙线程撕裂者的时候就已经把HEDT平台的头把交椅夺了过来，第三代锐龙线程撕裂处理器的推出只会让AMD在这个位置上座得更稳，Intel在多核市场还真玩不过AMD，不然也不会做出把Core i9-9980XE价格腰斩，第十代酷睿X价格大幅下调这种事情出来。可能有人会拿那个28核的Xeon W-3175X来说事，不过它价格实在是太高了，根本不在同一个水平，而且AMD之后还有64核的锐龙Threadripper 3990X要出呢，64核对28核，不用想都知道结果会怎么样。

　　32核的锐龙Threadripper 3970X上市价是15299元，而24核的锐龙Threadripper 3960X则是10699元，去年锐龙Threadripper 2990WX上市价是13999元，锐龙Threadripper 2970WX则是9999元，可见第三代锐龙线程撕裂者的售价是要比上代产品要高的，当然了Zen 2架构的性能比Zen+强多了，还支持PCI-E 4.0，TRX40平台也比X399平台有更强的扩展能力，这些都可能是AMD把价格提高的因素，不过我觉得最重要的原因是AMD目前不打算把X399平台退市，而是作为一个稍微便宜一点的HEDT平台继续销售，毕竟X399平台在扩展能力和核心数量上都不是主流的X570平台可比的，这也不失为丰富自家HEDT平台产品线的一个方法。

　　至此，AMD的Zen 2架构处理器已经在桌面市场上阶段性的布局完毕，7月份发布的第三代锐龙处理器面向主流市场，而今天发布的第三代锐龙线程撕裂者则面向高端发烧友和工作站，桌面市场是上大部分产品都由高性能的Zen 2架构所取代，而AMD的下一步，应该就是要把Zen 2架构推向移动平台，让更多的用户能享受到这款7nm处理器所带来的极佳能耗比。

上一篇：NV线nm显卡下一篇：英特尔与联发科SOC巨头联手：PC行业要变天了

AMD锐龙线X首测稳坐HEDT平台头把交椅

搜索

分类导航

最新文章

热门文章

随机文章

AMD锐龙线X首测 稳坐HEDT平台头把交椅

相关阅读

搜索

分类导航

最新文章

热门文章

随机文章

AMD锐龙线X首测稳坐HEDT平台头把交椅