记者10月30日获悉,中国移动联合13家产业伙伴于日前发布了国内首个支持智算应用一键式跨架构迁移平台——算力原生“芯合”。该项自主创新成果对我国自主智算芯片及软件生态繁荣发展具有重要意义。
智算领域,芯片为本,软件为核。近年来,随着多样化异构智算芯片的涌现,产业界形成了多套“AI框架+工具链+硬件”的软硬一体竖井生态,上层应用与底层智算芯片深度绑定,但由此也带来了应用开发迁移成本高昂、智算资源难以集聚、智算芯片企业多而不强等挑战。
为屏蔽异构硬件差异、融通智算竖井生态,中国移动以智算基础软件栈为攻关要点,联合产业于2022年率先提出算力原生原创技术,并于2023年启动“芯合”计划。算力原生“芯合”平台在研发过程中,打破了产业各自为战的传统模式,建立了智算生态协同桥梁,并以典型应用为牵引,制定了端到端的开发、编译运行机制和相关标准,形成了平台软件研发、芯片对接适配、应用融合验证的闭环攻关体系。
据了解,该平台可依托四大自研核心组件提供跨架构一站式解决方案。目前,该平台已实现图像处理、视频分析等典型智算应用在三家智算芯片企业之间的一键部署和实时迁移,且迁移速率小于10秒,性能损耗不高于15%。中国移动相关负责人表示,该平台已初步具备商用条件,未来将在提升智能算力网络自主可控水平方面发挥重要作用。
突破算力瓶颈的两大方式
中国近年来提出把计算和网络融合起来,“东数西算”工程的推进是很重要的大方向。从技术方面来看,其实它就是在构造一个以能源、计算能效性为优先综合布局的新型算力网。
东部的数据量很大,包括游戏、智慧城市、智能驾驶、交通等有非常多数据产生和使用。还有很多地区能效比高,很多自然能源可以使用,适合建立建数据中心。这个概念在上面看是一张算力网,通过网络把它连接起来,当中的底层技术非常复杂,因为网络有延迟,很多应用根据数据处理和应用的需求对延迟的敏感度不太一样。
对于数据处理,无论是算力还是网络构造,都很有独特的要求。从数据量和质来看,传统的单一计算架构肯定会碰到性能和功耗的瓶颈。因此,我们要朝两方面迈进:第一,是突破算力瓶颈,通过不同的方式解决多样化数据的计算有效性; 第二,在提升算力的时候,还需要考虑到绿色计算,不能用很耗能的计算方式去解决问题,要想如何以能量优化的方式去解决未来的数据处理。
解决上述问题,异构计算和异构集成是未来的两大方向。
何为异构计算?就是用不同的架构处理不同类型的数据,真正做到“用好的工具解决好的问题”。
何为异构集成?是以更好的集成组合方式,把不同工艺下优化好的模块更好地集成到未来的解决方案当中,从而更加高效地处理复杂计算。
在“解决问题”的这个思路下,首先我们要能够在硬件的架构布局上“全面发展”,对不同的数据有不同的处理器架构,比如说CPU、GPU、IPU、FPGA、AI加速器,它们各自针对不同种类的数据流,包括数据处理的不同特点,可以进行定制。
再者,把不同架构组装起来后,就需要有人根据应用的要求进行编程,释放硬件的功能,把它调度好,这就需要有一个对应的很好的软件框架,英特尔的oneAPI就在构造一个完整的异构计算体系,目的是未来写一个软件,只需要让应用者指定它的功能,而不需要非常明确地指定哪些部分运行在CPU上,哪些部分运行在GPU上,哪些部分运行在AI加速器上。通过底层的软件功能模块和工具链,就可以把下面具体的实现分布在不同的硬件上,硬件发生变化,下面具体的实现也发生相应变化,但是上面的软件开发代码是不用变的。
国内芯片厂商跟进
不同于国际大厂在各方面实力雄厚,国内厂商难以在短时间内形成如此全的产品线,但是国产芯片厂商现在已经渐渐开始选择通过投资和合作的方式埋下异构的种子。
2021年11月,GPU芯片企业壁仞科技,与IDG资本、字节跳动等共同参与了国产DPU初创企业云脉芯联数亿元的天使轮投资。据壁仞科技创始人、董事长、CEO张文透露,除了DPU之外,从布局整体计算产业出发,壁仞科技正在密切关注国产CPU的最新发展,未来形成CPU+GPU+DPU的全国产系统级解决方案。
日前,DPU芯片厂商云豹智能与AI芯片厂商燧原科技达成了战略合作,共同研发和提供大规模高性能AI算力平台解决方案。基于云豹智能云霄DPU和燧原科技云燧T20率先推出了DataDirectPathStorage解决方案,为AI训练储存访问提供更高效的解决方案。在传统解决方案中,云燧T20访问存储时,需要将数据先搬移到系统内存,再由系统内存搬移到目标设备。而基于DataDirectPath Storage技术,云燧T20可通过DPU直接获得数据,从而绕过系统内存和CPU,让数据访问速度更快,访问延迟更短,系统开销更小。
此外,国内还有异构处理器IP提供商华夏芯,通过自主设计的Unity统一指令集架构和基于此架构的CPU、DSP、GPU、AI专用处理器系列IP与SoC,在提升性能价格比的同时,显著降低计算芯片研发成本和研发复杂度,同时缩短研发周期,减少开发人员工作量和降低开发门槛。据悉,华夏芯的Unity和英特尔的OneAPI都是为了简化编程环境,但不同的是,OneAPI是面向不同体系架构的统一编程环境,Unity是面向不同微架构的统一体系架构和统一编程环境。
晶圆厂和封装厂在异构集成上的布局
异构计算的强大只有完备的通用计算芯片产品线还不够,还必须要有先进的异构集成封装技术将其巧妙的封装在一起,才能达到最终提升算力的目的。因此,这几年异构集成也重新定义了封装在芯片产业链中的地位,现在封装起到一个重新架构的作用。
过去,考虑到功耗、性能、成本等因素的影响,芯片的集成首先在单片上进行,例如SoC。但现在摩尔定律逐渐来到极限,在单片上继续微缩,成本效益越发不受控制。而得益于近十年来先进封装与芯片堆叠技术的发展,例如3D堆叠、SiP等,也使得异构集成成为了大幅存在可能。
异构集成主要是将多个不同工艺节点的芯片封装到一个封装内部,这些芯片可以是不同种类、不同制造商、甚至是不同材料(Si/SiC/GaN)、不同工艺节点(如7nm和28nm等搭配),以此来达到增强功能和提高性能。新的封装技术能够将来自不同制造工艺流程的小芯片集成到具有多种功能的单个封装中。
为此,无论是台积电、三星和英特尔这样的晶圆大厂,还是封装厂,都在积极布局异构集成,在半导体后道技术上做好集成的工作。先进封装逐渐成为集成电路芯片成品制造产业的关键工艺技术之一。