近2年国产GPU领域受到投资热捧,多家国产GPU初创公司获得大额融资,甚至有成立仅仅100天的GPU公司获得数十亿元的融资。一直以来,无论是GPU还是GPGPU,国内厂商与国外巨头相比差距都极其巨大,不过与以往不同的是,近年来除了如景嘉微、兆芯等老牌厂商外,还诞生了不少初创公司,并且在2020年也获得产品落地的新进展。一众初创公司纷纷高调进入且获得数十亿级的巨额风投而备受关注。但是喧闹过后,市场上仍缺乏可与国际巨头对标的量产产品,去年年底,芯动科技潜心为中国5G数据中心定制的高性能显卡GPU芯片——“风华1号”回片测试成功,全球首发,这是否有望改变服务器级高性能GPU国产无芯的局面呢?
对于近2年掀起的国产GPU投资热,芯动科技首席SoC架构师何颖认为,这既是商业化的需求,也是国家战略替代的需求。“GPU市场非常大,但相较于已有一定积累的CPU来说,我国在GPU方面的发展进度还十分缓慢。目前桌面和移动端的GPU基本被NVIDIA、AMD、ARM垄断,所以国产替代的空间和潜能也很大。国产GPU和CPU一样,也是具有国家战略意义的高端集成电路产品,可以说是一个巨大的蓝海市场。投资者青睐GPU领域其实也是看好这个市场的巨大发展前景和机会。”
另一方面,在GPU投资热之下,其背后的投机属性也不能忽视。“一方面,一些GPU新势力尚没有明确自己的细分市场,没有想清楚未来长远的发展方向,还只是停留在PPT阶段,所以尽管热度高涨,但真正能用产品说话的企业非常少,尤其是高性能商业化的渲染GPU产品凤毛麟角。另一方面,GPU技术门槛高,长期被NVIDIA和AMD等霸主垄断,新势力想要生存必须掌握有核心技术,有多年的技术积累和人才资金供给。长远来看,GPU领域在竞争中将会逐渐由多家公司收敛成屈指可数的几家公司。”何颖解释道。
当前,无论是GPU还是GPGPU市场,都基本由NVIDIA、AMD垄断,新晋企业竞争难度可想而知,但同时这也正是国产替代需求的根源。不过,对于选择GPU或是GPGPU路线,各家企业都有不同考量。
比如芯动科技选择了图形渲染GPU作为切入点,何颖对《华强电子》记者表示:“虽然GPGPU的价值很高,增长也不错,但细分市场总的体量还是远不及图形渲染领域。芯动选择的是一个起步很难但可以走得很远的赛道。”
据何颖介绍,目前大多数初创公司基本上是做GPGPU,而原因是通用计算型GPU主要实现的还是相对比较简单的一些AI运算,相对图形渲染GPU是小容量的市场。而图形渲染GPU因为其流水线(pipeline)特别长,经过了十几年的演化进程,实现起来会更加复杂,设计也要难得多,同时还存在着很多专利陷阱,也就是人们常说的雷区(Minefield)。
与此同时,相比于CPU,GPU尽管指令集相对简单,但计算核的数量多出一个数量级,所以GPU在执行可并行度高的计算时会大幅提高计算效率。也因为计算核数量多,一般而言GPU芯片中的逻辑门数量会比CPU多十倍以上。当GPU用作三维图形实时处理时,画面中的每一个像素颜色都经过GPU上百次计算而产生的,其架构设计也要不断更改来适应新的市场需求,这也是GPU系统复杂的原因之一。
另一方面,GPU架构具有多个计算核,可以对同一个指令用不同的数据并行计算,所以,GPU也适合处理数据密集型、高度并行化的计算任务。因此,在近年兴起的AI浪潮中,由于对用传统语言编写的、软件形式的计算有较好支持,GPGPU应运而生,爆发出大量需求。
这与前些年的AI芯片热潮有异曲同工之处,但相比于专用的ASIC芯片,GPGPU具有更加广泛的适用性、兼容性、灵活性、对技术变化的包容和适应能力更为突出,产品的应用生命周期更长。不过,尽管现阶段聚焦于GPU市场,但据何颖透露,芯动未来也会有GPGPU的规划。
纵观国内GPU的发展历程,除了主要用于军工的景嘉微、用于特殊应用的中船重工外,民用产品就只有兆芯,而兆芯的GPU技术事实上是来源于美国S3公司。GPU系统设计复杂且庞大,涉及面广,因此需要一个技术积累过程。
何颖坦言:“由于做GPU设计的复杂度确实很大,架构从零开始设计的时间周期太长,涉及的专利太多,所以芯动做GPU设计‘站在了巨人的肩膀上’。”
他还透露,基于Imagination的架构授权,芯动开发了“风华”系列GPU,并且在架构授权上进行自研演进,这是自主可控的,“芯动科技与Imagination的合作是与苹果一样的架构授权,而不仅仅是某一个IP的授权。如何把这个架构做成最终的GPU,不是简单的堆砌核和各种IP就行了,如何把他们有机地利用、调用起来,如何通讯都要付出大量努力。芯动在这个初始架构上探索了很多自己的方案,包括自研的Cache一致性Innolink Chiplet技术,内置国产物理不可克隆iUnique Security PUF信息安全加密技术,提升数据安全和算力抗攻击性等等。”
得益于Imagination BXT架构的多核可扩展性,芯动能够为客户打造量身定制、融合图形和智能计算的显卡芯片解决方案,以满足高端桌面和数据中心的需求。另外,由于现有的架构是基于安卓开发的原生架构,风华GPU在安卓云游戏上也会更具备优势,而且可以适配ARM、X86服务器平台,对各种Linux、安卓和国产各种操作系统都能支持。
在市场方面,何颖表示:“国产信创桌面和服务器这两大细分领域,其中服务器主要是指安卓云游戏领域。一方面,信创市场做的是国产替代,另一方面我们选择做更商业化的产品,也就是云服务器和云游戏的市场。我们敢于拥抱商业化的竞争,做更商业化的产品。”
不过,GPU并不只是拥有了核心架构就能够产出可用的产品。何颖补充道:“站在巨人的肩膀上能成功也必须自身够硬。凭借芯动在GDDR6/6X高速存储、缓存一致的多晶粒封装芯片(Chiplet)创新、以及高性能多媒体处理器优化等方面的坚实积累,进而去开发独立的、支持PCI-E规格的GPU显卡芯片是水到渠成的事情。”
在当前的国产GPU发展阶段,何颖指出:“国产GPU行业要采取开放合作的心态,要学会站在巨人的肩膀上,善于利用现有架构和生态,设计契合市场需求的优秀产品,打造全球化设计水平的开发团队。因为国产GPU发展到今天,我们可以集全国力量打造一个GPU软件团队,却很难组建GPU硬件团队,一些核心的模块基本都没有在中国设计过,所以我们现在还不具备相应的基础,但是可以在发展的过程中不断探索、学习。国产GPU在起步阶段兼容现有生态更容易发展,先求生存;长期还是要摆脱兼容思路,站稳脚跟后再求发展自有的核心技术。”
对于现阶段的国产GPU厂商来说,正面与NVIDIA、AMD、ARM等巨头正面竞争并不现实,寻找细分领域,找到可持续的落地场景,才是自身发展的持久驱动力。