2008年12月3日,AMD在中国上海,发布了首款以中国城市命名的“上海”核心45nm工艺皓龙(Opteron)处理器。究竟全新的“上海”皓龙处理器有什么特别之处?本文将为你揭开谜底。
2008年12月3日,AMD在上海超级计算中心举行了题为“芯动上海 融聚未来”的发布会,正式在中国发布代号为“上海”的新一代45nm四核皓龙(Opteron)处理器。在一代四核皓龙处理器“巴塞罗那”的基础上,“上海”再次刷新了AMD x86处理器的能效纪录,其性能高提升达35%,空载时的功耗可显著降低35%,虚拟化性能提高40%。
AMD和合作厂商一起谱写了“上海”新篇章
AMD全球副总裁王正福对于新一代四核AMD皓龙处理器在中国市场的未来表现具有非常大的信心。他说,新一代四核AMD皓龙处理器在虚拟化、高性能、低功耗和投资保护四个方面,为x86处理器树立了新的里程碑,顺应了当前既要应对计算需求增长、又要控制IT预算的形势,切合了用户对云计算、虚拟化等新计算技术的迫切需求。他进一步表示,“上海”的发布是AMD全新发展的新拐点,更是IT产业在这个“冬天”的新机遇。
●改进虚拟化技术。“上海”核心的四核皓龙处理器通过对AMD直连架构和AMD虚拟化技术(AMD-V)进行改进,使得它在虚拟机之间转换速度更快,软件虚拟化的开销更少,实现了高达40%的虚拟化性能提升。
●性能显著提升。“上海”核心四核皓龙处理器与上一代产品相比,性能大提高幅度为35%。他们虽然具有相同的热设计功耗,但“上海”大幅提高了CPU时钟频率,从而提高了性能。它的三级缓存容量增加了一倍,增强了虚拟化、数据库和Java等内存密集型应用要求的性能。后,它还支持DDR2 800内存,与现有AMD皓龙处理器相比,内存带宽有所提高。
●新的节能技术。新一代四核皓龙处理器采用了AMD智能预取、AMD CoolCore等新型节能技术,从而使功耗比上一代产品降低了35%。
●在投资保护方面,“上海”核心皓龙处理器的插槽和散热设计与“巴塞罗那”皓龙处理器兼容,即使是未来代号为“伊斯坦布尔”的AMD下一代六核皓龙处理器也使用相同的插槽。这样的设计可以帮助消费者减少平台升级的复杂性和费用,延长了数据中心的正常运行时间。
相比2003年的K8系列处理器,“上海”的发布无疑要低调很多。从“巴塞罗那”到“上海”,皓龙处理器的本质并没有太大的改变,核心架构也基本相同。可以这样认为,“上海”是“巴塞罗那”的优化版和加强版。相比“巴塞罗那”,“上海”在架构上有以下七个方面做出了重要改进:
AMD展示的45nm芯片的电子显微镜图片
在英特尔发布45nm处理器近一年之后,AMD终于推出了它们的45nm产品。和英特尔采用的193nm干蚀刻、高-k栅介质和金属栅极不同的是,AMD选择了沉浸式SOI光刻技术。沉浸式光刻技术在硅片和终成像镜头之间充满液体以缩短波长的一种光刻技术,这种技术提升了聚焦程度并改善影像精确度,进而加强芯片层级的效能与制程效能。目前AMD应用的是193nm沉浸式光刻技术。
SOI技术我们已经介绍过多次了,AMD和IBM合作开发的SOI技术首次被应用在K8处理器上,它的全称是Silicon-On-Insulator(绝缘衬底上的硅技术),其优点为工艺简单、集成密度高、寄生电容小、速度快等。除此之外,AMD也引用了超低-K介质和高-k栅介质来提升产品的性能和频率。超低-K介质主要目的是降低金属层间的电容量以及线间延迟(与传统低介电值介电层相比可减少约15%),并且对进一步提升处理器效能与减少能源耗损非常重要。
之前流传的“上海”处理器的核心架构图,清晰可见6MB超大缓存占据了较大的面积
从实际产品来看,AMD本次的45nm SOI沉浸式光刻技术非常成熟,产品起跳主频比较高,可以轻松攀升至3GHz大关。并且,AMD之前的超频演示,将基于同样制造技术的Phenom Ⅱ处理器通过液氮成功超频至6GHz大关,并顺利运行《Crysis》游戏。
相比之下,Core i7 965 Extreme处理器虽然也被超频至5.7GHz,但是已经无法进入系统。除去架构因素外,AMD处理器这次在主频之争中和英特尔还有好戏上演。
这也是“上海”相对于“巴塞罗那”为显著的进步之一。之前“巴塞罗那”仅有2MB三级缓存,在大量对缓存非常敏感的应用中,如虚拟化,数据库等应用的性能表现不佳。在升级至6MB缓存后,“上海”在这方面将有更强悍的表现。由于缓存容量增大,“上海”在缓存结构上也做出了扩展,将“巴塞罗那”的32路缓存关联扩展至48路。
除了三级缓存的扩展外,“上海”也针对“巴塞罗那”处理器的缓存进行了优化设计。虽然L1缓存在容量上依旧是64KB指令缓存和64KB追踪缓存的搭配,但带宽比“巴塞罗那”处理器增加了30%,L2缓存带宽也增加了接近25%,同时L3缓存的带宽也飙升到了6600MB/s以上,相比“巴塞罗那”5100MB/s的速度增加了接近30%。更高速的缓存有助于帮助处理器更为迅速地得到数据,减少等待时间,提升性能。
“巴塞罗那”采用了HT 1.0总线,带宽仅有6.4GB/s,而“上海”采用的HT 3.0总线速度高达17.8GB/s。由于皓龙处理器均通过HT总线和CPU以及北桥连接,更为高速的总线有助于提升系统整体效能,并大大加强处理器并行处理效率。
皓龙处理器支持三条HT 3.0总线,其中一条用于处理器和北桥交换数据,另外两条用于处理器间的通讯。
目前英特尔也已经开发出了QPI总线和HT总线与之分庭抗礼,不过基于“nehalem”的至强处理器尚未正式上市,因此AMD依旧拥有总线方面的绝对优势。但AMD目前仍然没有一款服务器级主板可以搭配HT 3.0总线来使用。
之前的产品都是基于HT 1.0总线的,无法完全发挥到HT3.0的高带宽优势。AMD宣称其即将在2009年第二季度发布全新芯片组,即SR5670、SR5690北桥和SP5100南桥,完全支持HT 3.0总线,并和处理器组成“Fiorano”平台,以应对英特尔的挑战。
虚拟化技术是服务器应用中常用的技术之一。虚拟化技术为数据、计算能力、存储资源以及其他资源提供了一个逻辑视图,而不是物理视图。从应用角度来说,虚拟化技术可以让很多用户共同使用一台服务器,并进行完全不同的、不受影响的操作,达到节约设备投资,扩展应用范围的目的。比如应用虚拟化技术后,可以让一台物理服务器虚拟出许多虚拟机。这些虚拟机对用户来说,是一台台不同的设备,可以完成任何用户想要完成的工作,虚拟机之间毫无关联却又紧密相关。
AMD-V虚拟化技术可以增强快速虚拟化索引,提高了虚拟化应用的性能并允许虚拟机直接管理内存,而不是依赖于较慢的基于软件的方法。AMD宣称,应用AMD-V虚拟化技术,主机与客户机切换速度加快25%,并可关闭三级缓存索引,保证数据的完整性。
在服务器市场上,对虚拟化技术的支持是非常重要的功能,英特尔和AMD都有相类似的功能和选择,AMD-V展现了AMD的虚拟化技术上的优势,增强了用户的采购意向。
AMD重点对“上海”的节能能力进行了优化设计。目前AMD发布的包括主频高达2.7GHz的皓龙处理器在内,热设计功耗都仅有75W。同时AMD还加强了处理器运行中的节能设计,下面我们分别介绍这些技术:
1.继续使用PowerNow!技术,并设计了独立动态核心技术,允许每个核心依据工作情况,在不同的频率间自动调节,以达到节能的目的。
2.采用Dual Dynamic Power Management双动态电源管理技术。这项技术将处理器电源管理和内存控制器电源管理分开,两者互不干扰,并且可以分别省电。在降低处理器功耗的同时不会影响到内存性能,而处理器全忙但不需要内存数据时,内存控制器就可以进入节电模式。该技术在“巴塞罗那”上已经采用,“上海”处理器将继承使用。
3.Smart Fetch Technology技术可以暂停处理器中某个闲置核心,CoolCore技术可以关闭处理器不工作的部分,起到节能降温的作用。
总的来说,AMD在“上海”上的节能设计是相当出色的。一些测试数据表明,搭配高端的 “上海”核心皓龙2384处理器的服务器,整体平台待机功耗不到200W,而使用了2.3GHz的“巴塞罗那”核心皓龙2356处理器的服务器待机功耗就高达202W。满载功耗方面,皓龙2384在功耗测试中,整体功耗高只有280W左右,而皓龙2356则高达310W以上!竞争对手英特尔3.0GHz的至强E5472处理器的整体平台功耗更高,接近350W。
由于功耗降低,每瓦特性能自然上升了。在Scalable Hardware CPU的测试中,以“上海”核心皓龙2384的每瓦特性能为100分计算,“巴塞罗那”核心皓龙2356仅为70分,英特尔至强E5472高一些,也只有80分,在每瓦特性能上,“上海”皓龙表现出了巨大的优势。
除了每瓦特性能的优势外,AMD在“上海”皓龙的价格上也表现得比较厚道。比如2.5GHz的“上海”核心皓龙2380和2.3GHz的“巴塞罗那”核心皓龙2356价格基本处于同等水平,前者为698美元,后者为690美元。而2.5GHz的“上海”每瓦特性能比2.3GHz的“巴塞罗那”至少高出35%。按照AMD一贯的性价比优势来看,“上海”继续提升了皓龙的性价比。
从发布会来看,“上海”得到了大量服务器厂商的支持。惠普、IBM、戴尔、SUN、曙光、泰安等众多服务器厂商都推出了相关产品。根据AMD数据,目前已经有至少25款服务器产品采用新一代皓龙处理器,而上海超级计算机中心更是对新款皓龙表示出了极大兴趣。由于AMD的处理器接口相同,完全可以平滑升级,因此一些老用户可以用小的投资获得大的性能提升。目前“上海”的产品支持还是非常到位的,不会出现无板可配,无机可买的尴尬状况。并且AMD此次发布基本上做到了硬发布,发布会当天就可以在市场上买到“上海”处理器。
“上海”皓龙处理器还有其他方面的出色设计,如内存控制器由仅支持双通道DDR2 667升级至双通道DDR2 800;接口方面采用统一的Socket F接口,在电源供电设计和热设计上和之前的“巴塞罗那”皓龙处理器完全相同,可以平滑升级,保护投资。在浮点计算上,AMD设计了128bit的全浮点计算加速单元,加强处理器的浮点效能。另外,“上海”也加入了对SSE4的支持。
性能表现方面,AMD宣称:“上海”拥有高的2路和4路浮点性能测试成绩、高的2路和4路内存带宽测试成绩;在Web服务方面,则拥有2路和4路SPECweb2005的测试成绩;数据库方面则是高的2路SAP-SD Two-Tiger测试成绩;JAVA得到了高的2路和4路SPECjbb2005的JAVA性能测试成绩。
从AMD给出的成绩来看,性能表现的确不错,随后第三方测试机构的测试表明,“上海”相比“巴塞罗那”同频率下IPC(每时钟周期处理指令数)的提升幅度约为10%,性能则根据应用和软件的不同,提升约在5%至15%之间,某些项目可高达30%!相比英特尔目前同频率45nm的Xeon处理器基本相当,各有胜负。再考虑到AMD在功耗方面的优势,这份答卷已相当令人满意了。
AMD终于挤上了45nm的列车,不过AMD也必须谨慎,英特尔很快也将推出基于“nehalem”架构的至强处理器,它才是“上海”的真正对手。在采用了QPI总线之后,英特尔也终于进入了直连时代。这就意味着AMD在直连架构和HT总线上的优势就不明显了。在不久的将来,AMD分别在服务器平台准备了6核心处理器“伊斯坦布尔”,在桌面平台准备了Phenom Ⅱ以及Dragon平台迎接英特尔的挑战。面对英特尔“Tick-Tock”的发展模式和步步紧逼的产品,AMD如果不再快一点,就很难超越英特尔。目前来看,AMD已经做得不错了,下一站是“伊斯坦布尔”,从“上海”出发,一路走好!