12月27日,三星电子宣布与红帽(Red Hat)携手,三星首次在业内成功验证其CXL内存与红帽最新操作系统在用户环境中的互操作性,该进展将支持数据中心和企业客户利用CXL内存进行高性能计算,且无需对硬件进行重大调整。
据悉,三星针对红帽企业级Linux® (RHEL) 9.3优化了其 CXL 内存,并在红帽的KVM和Podman环境中验证了内存识别、读取和写入操作。
三星和红帽于2022年5月首次签署了关于合作开发下一代内存的合作意向书(MOU),并决定通过三星存储器研究中心(SMRC)持续推动CXL开源代码和参考模型的开发。目前双方的合作涵盖了多个领域,包括NVMe固态硬盘、CXL内存、计算内存/存储和Fabrics等一系列存储和内存产品。
另外,三星和红帽正在合作编写《RHEL 9.3 CXL内存使用指南》,旨在帮助用户在RHEL 9.3上充分发挥三星的CXL内存性能,并在各种用户环境中构建高性能计算系统。
三星电子表示,与红帽的 CXL 内存技术合作是先进软件与硬件合作的典范,这将丰富并加速整个 CXL 生态系统的发展。
存储芯片界的CPO
SK海力士副会长朴正浩曾在演讲中透露,随着ChatGPT等应用开启AI新时代,加上相关技术演进,预计全球数据生成、储存、处理量将呈等比级数增长。在技术演进的路上,为克服主机CPU存储器容量受限问题,CXL技术相当重要。
随着存储成本不断增加,传统的PCI-e技术逐渐乏力。以ChatGPT为代表的AI大模型对高性能存储芯片的需求与日俱增,在高容量、高运算能力的需求下,新的存储技术备受市场关注。在此背景下,基于PCI-e协议的CXL技术应运而生。
有媒体将CXL技术称为存储芯片界的CPO。CXL(全称Compute Express Link,意为计算快速链接)系英特尔于2019年推出的一种开放性互联协议,能够让CPU与GPU、FPGA或其他加速器之间实现高速高效的互联,从而满足高性能异构计算的要求。CXL技术具有高兼容性、内存一致性等优势。
在AMD、ARM、IBM以及英特尔等主要CPU供应商的支持下,CXL已经成为领先的行业标准。在AI的大时代下,随着CXL的应用渗透率提升,服务器也从传统围绕CPU的设计思路转向为以DRAM为中心的架构。
华西证券分析师刘奕司4月6日研报指出,CXL带来的DRAM池化技术可以大大节约数据中心的建设成本(TCO),同时也将大大带动DRAM的用量,节约下来的成本将会主要用于对DRAM的采购。TB级别的DRAM将会在更多通用性服务器中广泛使用。CXL技术有望进一步提高服务器效率,AI时代DRAM受益程度不亚于GPU。
美光科技在2022年5月与投资者交流时曾预测CXL相关产品的市场规模,到2025年预计将达到20亿美金,到2030年可能超过200亿美金。
各大厂商积极布局CXL,拥抱大AI时代。2019年,由英特尔牵头,联合谷歌、微软、HPE、戴尔易安信、思科、Meta和华为成立CXL联盟,当年推出了基于PCIe 5.0的第一版规范。此后,AMD、英伟达、三星、Arm、瑞萨、IBM等以各种身份加入。
CXL3.0助攻AI芯片
CXL联盟于2019年3月由创始成员阿里巴巴集团、思科系统、戴尔易安信、Meta、谷歌、惠普企业(HPE)、华为、英特尔公司和微软组成。此后,AMD、NVIDIA、三星、Arm、瑞萨、IBM、Keysight、Synopsys、Marvell等以各种身份加入。
2021年,Gen-Z联盟宣布将其所有技术规格和资产转让给CXL联盟。2022年8月OpenCAPI联盟宣布,与CXL联盟达成协议,将OpenCAPI和OMI规范以及OpenCAPI联盟的资产转让给CXL联盟。Gen-Z技术和OpenCAPI技术相继加入,意味着CXL联盟将一统I/O互连标准。
在过去不到四年里,CXL大胆向前,到现在已经发表了1.0/1.1、2.0、3.0三个不同的版本。CXL 为底层采用 PCIe 标准,在该标准巨大行业发展势头上带来了更多功能变革。
2019年CXL刚推出,PCIe 5.0是最新的标准,CXL 1.0、1.1以及之后的2.0代都使用了PCIe 5.0的32 GT/s信令。同时Specification 3.0被引入。CXL1.0规范解决了节点级互连的问题以及处理器与其连接设备之间的互连。CXL2.0带来了CXL交换机和内存池化的功能,通过支持跨多个节点的内存等资源池,将CXL提高到了机架级别。
CXL 3.0于2022年发布,采用PCIe 6.0作为其物理接口。CXL 3.0 与 PCIe 6.0 一样,使用 PAM4 将信号速率提高到 64 GT/s。CXL3.0在前代技术基础上做了进一步扩展,带宽提升2倍,并且简化了一些复杂的标准设计简单化,确保了易用性。并在物理层面和逻辑层面作了革新:CXL3.0将每通道吞吐量提升了一倍,达到64GT/s;CXL3.0扩展了标准逻辑能力,允许更复杂的连接拓扑。
CXL规范的推出速度非常快,在CXL 1.0技术还未准备就绪,CXL 2.0技术就兵临城下,新规范要求在总线的SerDes级别提供内置支持,从而实现和远程内存组的低延迟连接。鉴于财力雄厚的公司对 CXL 的支持日益高涨,该标准普及建设似有远大前程。但其快速发展也让 IP 开发人员难以快速从一个版本的标准转向下一个版本。因此,像AMD不得不在新处理器的设计后期重新设计了CXL部分功能,还融入了包括持久内存和RAS报告等功能。
2020年曾有业内人士预言要到2024年CXL才可能有落地产品,而实际上2022年就有初代产品问世,相关的合作伙伴也在找相应的厂商对一些工程样品搭建环境进行开发测试,从架构、IP到芯片,CXL的生态正在快速搭建。
在AI的大时代下,随着CXL的应用渗透率提升,服务器也从传统围绕CPU的设计思路转向为以DRAM为中心的架构。三星将CXL视为解决内存扩展挑战的最有前景的技术,不遗余力捣鼓DRAM。2022年5月,三星电子开发出业界首款 512 GB Compute Express Link (CXL) DRAM 模块,这是迈向 CXL 商业化的重要一步,官方数据显示,与之前的三星 CXL 产品相比,实现极高的内存容量和低延迟,用于下一代大容量企业服务器和数据中心。
在AI浪潮催化下,几乎每个人都在构建具有CXL功能的服务器。过去三年越来越多内存和服务器 SoC 公司都表示支持CXL,根据一些内存制造商的预测,到2030年,基于CXL的应用程序的总潜在市场预计将达到200亿美元。但CXL仍面临以下挑战:
尽管共享资源具有吸引力,但无论标准进展得有多快,广泛采用都需要时间。完全支持CXL拓扑和带宽的产品推向市场是一个较慢的过程;
数据中心在采用任何新技术时都比较保守,任何故障都可能导致数百万美元的停机时间因此不免有人猜忌和观望CXL;
CXL未来在数据中心的扩散仍面临缺乏验证和验证基础设施的挑战。这些解决方案在进行生产部署之前需要与OEM和云服务提供商一起进行严格的功能和性能验证过程。CXL需要为希望同时启动硬件软件验证、软件启动和合规性以实现其上市时间目标的公司提供更多软件优先方法的范例。
CXL将随着未来功能强度而普及化,也需要在云端业务大规模导入在产业中。