3月16日,当地时间周一AMD发布名为“米兰”(Milan)的服务器芯片,旨在从竞争对手英特尔手中夺取更多的市场份额。
AMD表示,公司最新发布的“米兰”服务器芯片比目前最好的数据中心芯片处理速度更快。据悉,AMD完成该芯片的设计,并委托台积电采用7纳米芯片制造工艺来实现量产。
发布会上,AMD高级副总裁兼服务器业务总经理DanMcNamara,AMD全球院士、Zen核心首席设计师MikeClark,AMD院士及SoC架构师NoahBeck,AMDEPYC产品管理全球副总裁RamPeddibhotla等接受了集微网在内的媒体采访,从架构、设计、产品等方面详细介绍了“米兰”背后的更多细节。
DanMcNamara表示,“米兰”的发布将会进一步巩固AMD在数据中心市场中的地位,无论是从核心还是系统层面都体现出优越的性能。对于市场用户而言,在整体拥有成本方面,“米兰”将带来更高的价值,同时AMD也在加速布局生态,推出围绕“米兰”的更多应用。
7nmZen3架构19%IPC性能提升
自2017年重返数据中心市场开始,AMD一直追求架构上的创新以及由此带来的性能飞越,从Zen1到到Zen3,都在IPC性能表现方面实现了显著提升。如采用Zen2架构的“罗马”发布时,实现了较上一代15%的IPC性能提升,而此次Zen3架构,实现了约19%的IPC性能提高,远高于行业平均水平。
据MikeClark介绍,要实现这样的进步,必须在整个架构的每个环节去分别优化。首先,在Zen3上,AMD改善了分支预测的功能,不仅提高了准确性同时能够更快的到达目标,同时在系统中能发出更快指令,更高指数的吞吐量,增加了更多的流水线提高吞吐量,同时也为推理方面的工作负载去更强的赋能。从四核到八核都让整个通讯的速度加快,效果更完善,即使是在线程数比较低的系统中由于能够实现共享内存调用,可以降低有效的内存访问的延迟。
具体而言,从Zen2到Zen3,在前端改进方面,AMD将BTB提高了一倍,达到1024。同时增加了分支预测器的带宽,另外在分支预测中消除了冒泡现象,因为冒泡现象在很多架构中是常见问题,能够更快的从误测中去恢复,能够更快的寻址。
MikeClark表示,对于更大的服务器工作负载而言,Zen3可以更无缝的在opcache和Icache切换,实现现更高颗粒度的流水线切换。
在执行部分,Zen3首先针对整数设置了专用的分支和ST数据拣选器,有更大的窗口,减少了某些运行时延,在浮点方面增加两个位宽的调度和分发,更快的FMAC周期,还有两条INT8的IMAC流水线。
在加载存储这部分Zen3有三个加载和两个存储,操作灵活性增加,也对内存依赖性的检测做了优化,同时对于这些非常随机内存的操作我们也提供了6个页表查询器去实现更好的TLB查询。
在指令集方面,在加速、加密和解密算法上Zen3扩展了AVX2指令到256位。MikeClark指出安全是改进最大的部分,首先对SEV的改进,限制中断的注入,限制恶意管理程序注入SEV-ES访客中断/异常类型,还有能够将调试寄存器添加到交换状态中。
此外,MikeClark介绍,在一代EPYC产品投入市场时,行业正在遭遇幽灵攻击,现在看当时的应对方式并不是最优解,但到目前三代时,应该说AMD从架构方面已经做好了强防御,同时对性能的折损也能够降到最低,在提升的IPC性能的同时,也大大增强了系统的安全性和稳定性。
目前AMD采用与第三方芯片制造商合作的方式量产。而英特尔采用的是自行制造芯片的不同战略,但最近一代芯片制造技术的延迟令其备受困扰。相比而言,“米兰”芯片及其前辈的表现都超过了英特尔芯片,帮助AMD抢到了更多市场份额,并赢得了Alphabet旗下谷歌等客户的青睐。
不过英特尔即将反击。分析师预计,英特尔将在未来几周推出最新的“冰湖”(IceLake)服务器芯片,这将是首款采用英特尔10纳米制造工艺量产的服务器芯片。英特尔10纳米制造工艺所生产芯片的性能相当于7纳米制造工艺的“米兰”芯片。
无论这两款芯片的速度如何,但AMD仍有望拥有一些优势,比如每个芯片上的计算内核数更多,这使得芯片可以同时处理更多的软件应用程序。