进入Zen时代之后,AMD在移动市场上获取了相当多的份额,其超轻薄、全功能和高性能产品得到了消费者的广泛欢迎。2022年2月,AMD发布了全新的锐龙6000系列移动处理器,带来了全新的6nm工艺、Zen 3+架构和RDNA 2架构的集成GPU。那么,全新的AMD锐龙6000系列移动处理器的实际表现如何呢?我们近期拿到一台搭载AMD锐龙9 6900HS处理器的笔记本,用它来看看新处理器的表现吧!
产品布局:10款产品覆盖全市场
在正式测试之前,我们先来看看AMD锐龙6000系列移动处理器的相关信息。本次AMD锐龙6000系列移动处理器一共有10款产品,覆盖全市场。其产品型号和参数列表如下:
可以看出,相近型号的产品其硬件规格是基本相同的,比如大家都是“6800”的话,那么基本的处理器核心单元数量、线程数量、基准频率和最高频率、CU单元配置和频率等都是基本完全相同的。那么怎么区别这些产品的性能呢?那就是TDP设置的差异了。TDP设置较高的处理器在高频率和高性能下维持的时间较长,性能会更好一些,反之则性能相对较弱,比如TDP功耗为15~28W的AMD锐龙7 6800U性能释放肯定无法跟35W和45W的产品相比
此外还可以看到,AMD目前有条件地在放开TDP功耗数值,供有条件的厂商自由发挥。比如在AMD锐龙9 6980HX和AMD锐龙9 6900HX两款处理器上,45W+的TDP功耗标定意味这两款产品还可能在厂商的调教中释放出更高的性能。另外,锐龙U系列处理器TDP功耗是厂商自己根据产品形态和性能定位来选择的,标准的15W主打传统轻薄本产品,也可能会设计出类似超轻薄的笔记本产品,而28W则能满足一些高性能轻薄本的功耗需求。
实际上,从目前的移动处理器发展情况来看,移动处理器的性能释放除了原始规格之外,最大的影响因素就是厂商对功耗、温度的控制情况,散热较好、温度控制得当的笔记本电脑在实际使用中的性能是要比散热一般、温控一般的表现更好。因此,对消费者来说,在购买笔记本电脑时,除了选择产品型号外,可能还需要进一步了解散热方案及产品定位。
性能、能耗比致胜:AMD锐龙6000系列移动处理器架构分析
在了解完产品型号后,接下来看看AMD锐龙6000系列移动处理器的架构。首先来看整体架构情况。AMD锐龙6000系列移动处理器采用台积电6nm工艺制造,CPU部分采用Zen 3+架构,GPU部分采用了全新的RDNA 2架构,内存方面提供了针对DDR5和LPDDR5的支持,平台方面支持PCIe 4.0、USB4、WiFi 6E、HDMI 2.1、DP 2.0、新AV1解码等一揽子新技术。可以说,AMD锐龙6000系列移动处理器是目前最先进的移动计算平台,技术规格和应用支持也是最全面的。
从生产工艺发展情况来看,台积电目前可以给市场提供的最先进的大规模量产工艺应该是TSMC N4,也就是所谓的4nm。不过,对处理器这种复杂产品来说,工艺是否先进并非首先需要考虑的因素,反之合适的工艺才是最好的工艺。在这一点上,目前AMD锐龙6000系列移动处理器选择的6nm工艺相当到位。
台积电之前给出TSMC N6(我们俗称的6nm工艺)的相关参数和介绍表明,TSMC N6工艺是TSMC N7(7nm)工艺的改进版本,其设计方法和TSMC N7完全相同,因此厂商可以很快从TSMC N7过渡到TSMC N6而不需要做太多的工作。TSMC N6相比TSMC N7,整体密度提升了18%,功耗和性能分别最多降低10%和提升2%。从这一点来看,AMD之前的锐龙5000系列处理器和Zen 3架构以及RDNA 2系列GPU采用的都是TSMC N7工艺生产制造,因此转移到TSMC N6工艺的速度非常块。即使新的处理器使用了部分新的设计,但是之前没有改变设计的部分依旧可以快速迁移到TSMC N6上,节约大量的时间。
不仅如此,在TSMC N6工艺使用后,利用其增高的晶体管密度,AMD还可以更为从容地布置更多的性能或者功能单元而不会太过于担心因提升芯片面积从而带来成本大幅度增加的情况,这也是新工艺带来的优势之一。
接下来看看全新Zen 3+架构。AMD的Zen 3架构是近几年来最成功、性能最出色的CPU架构之一。AMD锐龙6000系列移动处理器采用Zen 3改进版本的Zen 3+架构,AMD宣称其所有的优化设计都是为了效能,这个新的架构有两个设计目标:提供x86笔记本电脑领先的性能,同时提供x86笔记本电脑最佳的电池续航表现。为了达到这两个目标,AMD为Zen 3+架构进行了五大方面的优化。
第一个方面是之前本文提到的全新的6nm工艺。AMD通过新工艺的改进,能够提供尽可能高的每瓦性能和每平方毫米性能。第二个方面则是为架构方面的改进。AMD为Zen 3+架构提供了50多项有关能耗方面的改进。AMD给出了一个综述的目录,如下:
1. 针对每个线程的功率和时钟控制(Per-Thread Power/Clock Control):进一步精细化CPU内部功耗控制粒度,现在可以做到针对每个线程进行控制,而不是传统的每个核心。这样做的原因是,一个线程在核心内运行时,可能并不需要唤醒核心的所有部分,这可以在很大程度上将能量精准地分配到那些需要操作的部分,其余部分则依旧保持低功耗状态。
2. 漏电控制(LEAKAGE):设计端和工艺端共同配合进行漏电方面的控制,以获得更好的效能。
3. 延迟L3初始化(Delayed L3 Initialization):CPU唤醒的过程可以跳过L3进行操作,以改善延迟。一般来说,唤醒过程如果需要初始化L3的话需要耗费更多的时间,Zen 3+架构采用了异步L3设计,唤醒CPU时不需要同步初始化L3,节约了时间并降低了功耗。
4. 缓存缺失计数器(Cache Dirtiness Counter):当缓存工作负载很高的时候,比如工作负载数据量大于L3容量,这个时候L3缓存会出现频繁的缺失。一般来说,缓存在这个情况下会进入低功耗状态。但AMD在Zen 3+中禁止在这种情况下缓存进入低功耗状态,而是持续维持缓存的性能。短期来看这对能耗表现不利,但是考虑到CPU长期工作的需要,不会频繁唤醒、休眠缓存从而造成L3缓存延迟提升,因此长远来看反而是节能、提升性能的设计。
5. 峰值电流控制(Peak current control):尽可能好的控制电流从空闲到峰值的功率斜率,以减少压力并节约电力,避免对线路造成冲击。
6. 针对线程的CPPC(CPPC per thread capability):之前操作系统只针对每个核心进行工作负载控制,现在可以直接针对每个线程。
7. PC6恢复过程(PC6 RESTORE):通过硬件辅助,系统可以更快的从睡眠中恢复并提供性能,这个切换速度比上代产品快了4倍。
8. 选择性的SCFCTP状态保存(Selective SCFCTP Save on PC6 Entry):当系统从PC6状态中恢复时,参考进入PC6状态之前的系统利用率,并选择性的唤醒部分部件,而不是所有。
9. 增强的CC1状态(Enhanced CC1 State):当内核没有工作处于空闲状态时,使用更好的方式将其纳入睡眠状态。
从AMD的功能描述来看,由于Zen 3+针对的是移动处理器市场,因此其绝大部分功能改进都是针对移动设备在进入休眠、睡眠状态的节能或快速唤醒的即时响应设计。一般来说,诸如AMD锐龙7 6800HS这样拥有8个CPU核心的大型处理器是很难在同时间内实现整个CPU部分都呈现满载状态的,总有一部分模块、核心甚至几乎全部处理器都处于空闲状态,因此如果能正确地判断哪些部件处于空闲状态并命令其迅速睡眠以节约能耗,并且还可以从睡眠状态迅速唤醒以提高响应速度,是非常重要的。值得注意的是,不断的切换内核的工作状态本身也是耗能的,这里就涉及到AMD对处理器的智能控制方案,这一点也非常考验SoC设计能力。
第三个大的改进方面则是SoC层级的能耗控制。前文介绍了Zen 3+ CPU内核的能耗控制,接下来上升一个层级来到了SoC层面。AMD列出了5个方面的能耗控制情况,分别是:
1.AMD Infinity Fabric的Z-STATES状态。AMD的SoC内部采用了Infinity Fabric总线连接,由于SoC内部的不同模块并不是一直处于满载状态,因此响应的总线数据传输也需要节能控制。在这里AMD设定了4个状态,分别是DFC0、DFC1、DFC2和DFC3,分别针对Infinity Fabric的活动(满载)、轻任务、维持状态以及睡眠状态,这样可以更好地实现SoC层面的能耗控制。
2. SoC功耗分区控制:AMD增加了3个状态,分别是被称为Z10状态的主要框架关闭、Z9状态的芯片关闭但是显示模块打开以及DRAM自刷新等。
3.低功耗设计:这部分主要是工艺方面的内容,比如之前提到的6nm工艺,采用优化设计库、低功耗的布局和封装等。这部分内容显示AMD可能针对TSMC N6工艺更侧重于节能设计。
4.快速睡眠状态恢复加速器:AMD在新的SoC的包括CPU、GPU、Infinity Fabric总线、内存控制器以及显示引擎方面都加入了新的、更快切换睡眠和恢复状态的加速器,能够使得这些部件更快速的进入睡眠状态,也能更快速的从睡眠状态中恢复。
5.平台功耗控制:这部分主要是AMD对整个设备平台功耗控制的内容,包括采用低功耗的LPDDR5内存、支持小于1W的显示部分、支持显示面板自刷新以及增量更新等技术。
有关SoC层级的功耗控制,AMD还给出更为详细的内容。其主要包括:一是针对CPU、GPU、显示以及USB、总线等部分的独立电源分区控制;二是新的硬件辅助加速器,用于更快速的切换部件的睡眠和唤醒状态;三是改进的时钟门控和电源门控,AMD改善了新处理器的物理时钟和功率门控功能,并且适用于所有的模块和单元;四是新的内存控制机制,加入了新的RAM关机控制,并且拥有新的旁路模式可以使得RAM直接使用非标电压来实现节能功能,还可以针对不同的内存通道、内存插座和内存区块进行控制;最后则是新型EDC控制器,增强了处理器的电器设计约束控制,以实现SoC更多的颗粒的控制。结合之前的内容和后续新增的内容,AMD基本上针对整个SoC进行了全面而细粒度的控制,这意味着AMD在移动处理器的功耗控制上已经非常成熟了。
第四个大方面则是软件控制。这里主要指的是针对整个笔记本电脑平台的固件和软件控制的内容。在之前的绝大部分笔记本电脑上,Windows(或者其他操作系统)会根据自己的默认设置比如“平衡”“高性能”“节能”来进行整个系统的功耗、性能和散热控制,当然有些OEM厂商也会提供自己的定制化控制。不过,AMD本次提供了更为精准的版本,希望可以为用户提供性能更高、更为节能的设计,并且整个控制完全不需要用户手动操作,这就是AMD新的功耗管理框架(POWER MANAGEMENT FRAMEWORK),简称为PMF。
PMF可以从笔记本电脑传感器获取各种数据,比如风扇转速、处理器温度、SoC耗电情况、显示信息、工作负载、噪声情况等,将其转换为功率配置文件,输出更为符合实际情况的配置内容,具体包括系统配置信息(SPL、fPPT、sPPT、STT等系统功率、性能控制信息)、PMFW DC配置信息、其他系统信息(包括CPU频率、风扇控制、显示亮度、屏幕锁定、智能DC控制等)等,从而实现领先的节能配置和高性能配置。
AMD的信息显示,PMF将根据实际情况进行处理,其内容将直接写入系统固件,用户不可手动关闭,只有AMD和供应商(也就是笔记本电脑厂商)才能决定是否使用PMF。对用户来说,只要选择Windows的标准配置文件,AMD的PMF就可以自动启动,用户虽然可以在系统中选择不同的配置方案或者强制进入某种模式,但这只会改变PMF的控制范围,并不能强制关闭PMF。不过,目前没有厂商表明自己是否启用了PMF,未来可能也不会有太多消息披露,因此PMF可能将不会成为产品信息的一部分,对那些有特殊需求的用户来说,暂时很难获得系统功耗和性能控制的全部功能。
第五个大方面是整个平台的控制,主要包括新的显示控制优化部分。这部分内容较多,主要包括这些内容:新的Z-STATES,这个功能可以通过PSR-SU(面板自我刷新-选择性更新的功能),使得SoC逐步关闭显示控制器,以节约电能;支持低于1W功耗的面板,比如300nits最大亮度的1080p面板,从而实现更长的电源寿命;PSR-SU控制,这个功能可以使得用户在播放视频时降低屏幕刷新率,从而节约能耗。部分视频一般以24Hz制作和播放,因此显示屏也没有必要在传统的60Hz下刷新,降低至24Hz刷新可以节约大量能耗等。
上述五个大方面的能耗控制改进就是AMD在Zen 3+架构上提供的五大层级的改进。实际上从AMD的描述来看,这些改进并不是仅仅着眼于Zen 3+,而是遍及整个SoC的方方面面。通过上述改进,AMD锐龙6000系列移动处理器在进一步提高Zen 3架构性能的基础上,还带来了功耗方面的巨大提升。
另外还需要提及的是,AMD在锐龙6000系列移动处理器的内置GPU方面采用了全新的AMD RDNA 2架构,可谓是跨越式的提升,新的架构带来了翻倍的图形性能和更多功能,尤其是带来了对DirectX 12的支持,加入了光线追踪等更为现代的API等。当然对光线追踪来说,在这样的集成显卡上实际上并无太多实际意义,但是这在市场端能够形成对英特尔在技术和市场竞争上的显著优势。再加上LPDDR5或者DDR5带来的高带宽,AMD的锐龙6000系列移动处理器在图形性能上显然进了一大步,竞争力更强了。