世界已经为生成式人工智能疯狂,而且会变得更加疯狂。到 2027 年,每年的 GPU 硬件支出将达到4000亿美元。
Gartner 的 IT 市场分析师预计,2024 年的 IT 总支出(包括硬件、软件、IT 服务和电信服务)将达到 5.13 万亿美元,同比增长 8.8%。其中,只有 2355 亿美元预计将用于数据中心系统,即全球销售的所有服务器、所有存储设备和所有交换设备。我们认为,这主要得益于用于生成式人工智能的人工智能集群的快速采用,尽管在数据中心的更多通用服务中,基础设施支出出现了相当严重的下滑,但这一数字仍增长了 8.1%。
现在,这只是 AI 加速器业务数据中心部分的 TAM,不包括边缘和客户端 AI 硬件加速器的 TAM。AMD 没有讨论更广泛的芯片市场的 TAM 是多少。几个月前,IDC 还预测,到 2027 年,整个服务器业务的规模将略低于 2000 亿美元。
如果逆向计算,使用人工智能服务器的 GPU 成本约占整体价格的 53% 这一比例,即基于八路 Nvidia HGX GPU 计算复合机的 37.5 万美元货款中约有 20 万美元,那么如果我们对 IDC 预测的服务器市场以及人工智能和非人工智能服务器之间的分工的猜测是正确的,那么人工智能加速器硬件在 2027 年应该只能推动约 500 亿美元的 GPU 发展。显然,有人需要修改他们对这一切将如何发展的估计,以及 AMD 所称的 "数据中心 AI 加速器 "的确切含义。它肯定是指 GPU 和 NNP,但也可能指 CPU 的部分销售额。
无论如何,AMD 所说的是,增长速度超过了计划,加速器的收入增长率将比我们几个月前估计的高出 9 倍。
我们认为这绝对称得上疯狂。假设图形处理器和其他加速器的价格随着 HBM 内存的下降而下降,那么如果这一切都按照苏世民团队预期的那样发展,这意味着销量将真正达到巨大的规模。有了这样的增长,许多供应商就有了足够的竞争和利润空间。
GPU市场规模高速增长
(一)图形处理市场GPU市场规模稳固增长
目前来看,游戏产业发展已进入存量市场时代。2022年中国游戏市场销售收入2658.84亿元,同比下降10.33%;用户规模6.64亿,同比下降0.33%。但随着游戏玩家对游戏画质、图像帧率等需求的不断提升,需要高性能 GPU 在特殊渲染算法等方面提供支持,图形处理器在游戏端仍将占有较大份额。
在专业图形渲染领域,国内建筑设计、工业设计、影视动画、虚拟现实等应用专业图形渲染技术的细分领域正在蓬勃发展。作为专业图形渲染核心工具,2022 年国内图形设计/编辑/渲染软件市场规模达到536.99亿元,预计2023-2030年复合增长率为9.62%,据此测算国内 2030年该市场规模将达到1120亿元左右。图形设计/编辑/渲染软件借助高性能 GPU 提升图形处理能力,以支撑渲染技术的应用,以及高清晰画质、多帧率图像的呈现。
(二)大规模扩展计算能力的高性能计算市场爆发
随着大数据时代的到来,GPU 在并行计算方面的性能优势逐步显现,GPGPU应运而生。GPGPU 作为运算协处理器,针对不同应用领域的需求,增加了专用向量、张量、矩阵运算指令,提升了浮点运算的精度和性能,其产品技术特性已经超过传统图形处理的应用范畴,在数据中心、人工智能、自动驾驶等高性能计算领域发挥重要作用。
根据《中国算力发展指数白皮书(2022 年)》,2021 年国内基础设施算力规模达到 140 EFLOPS,位居全球第二,已经投入运行的人工智能计算中心近 20个,在建设的人工智能计算中心超20个。根据工信部《新型数据中心发展三年行动计划(2021-2023)》和《“十四五”信息通信行业发展规划》的目标,2023 年我国数据中心总算力将超过 200 EFLOPS,2025 年进一步提升至300 EFLOPS。GPU 作为实现算力的基础硬件之一,在数据中心建设和部署过程中具有广泛的配套需求。
在数据中心领域,作为算力的物理承载,国内数据中心持续建设与扩容,推动数据中心总机架数连年增长。2018-2022年总机架数由 166 万架增至650万架,近5年年均增速超过30%。预计2025年大型及以上数据中心机架数量将达到802万个,相应的算力规模持续扩大。
在人工智能领域,随着算法发展的突飞猛进,人工智能模型训练需要巨量算力支撑才能快速有效实施,不断增加的数据量也要求算力同步进化,使得算力成为人工智能技术突破的关键因素:作为生成式 AI 的典型应用,ChatGPT 引领人工智能技术变革,其大模型的特点带来了陡增的算力需求。作为算力的硬件基础,当前主流 AI 芯片包括 GPU、FPGA、ASIC 等。
2021年国内 AI 芯片市场规模达到 426.8 亿元,受益于算力需求的爆发式增长,预计 2025年市场规模将达到 1,780 亿元。Al服务器通常搭载GPU、FPGA、ASIC等加速芯片,利用CPU与加速芯片的组合可以满足高吞吐量互联的需求,为自然语言处理、计算机视觉、机器学习等Al应用场景提供强大的算力支持,支撑Al算法训练和推理过程。根据 IDC 数据,2021年国内服务器市场按加速卡类型划分市场份额中,GPU 占比为91.9%,系服务器市场按加速卡的主要产品类型,可以预见 GPU市场的巨大市场空间。
在自动驾驶领域, 2022年全球自动驾驶汽车市场规模为241 亿美元,预计 2026 年将达到 619 亿美元,年复合增长率为 20.75%。高级驾驶辅助系统(ADAS)作为实现自动驾驶的重要技术基础,利用 GPU 的并行计算能力实时分析来自激光雷达、毫米波雷达和红外摄像头的传感器数据,其大规模推广将带动高性能 GPU 的应用需求。
英伟达迎来更多挑战者
而在英伟达的身后,有许多年轻的初创公司正在奋力奔跑,有的不断推出号称超过英伟达GPU的产品,有的则瞄准了英伟达的CUDA编程平台。
据The Information,2017年至少有十几家初创公司试图挑战英伟达在AI芯片领域的地位,但经历了市场的一轮洗牌之后,该倒闭的倒闭,该换血的换血。
当时比较受关注的两家公司,KnuEdge和Reduced Energy Microsystems双双倒闭。Wave Computing在2020年申请破产,次年以新名称MIPS东山再起。据科技网站The Register报道,另一家AI芯片初创公司Mythic的前工程副总裁在领英上写道,该公司已于去年耗尽现金。今年早些时候,Mythic宣布任命新首席执行官,并获得了1300万美元融资。
在现存的早期AI芯片初创企业中,Cerebras生产的大规模AI芯片整合了英伟达GPU的许多处理能力,而SambaNova Systems似乎是早期最有能力挑战英伟达的公司。上一轮融资热潮中,这两家公司和Graphcore一起以数十亿美元的估值进行了几轮大型融资。
这轮市场大清洗告诉后来者,初创企业正面临着高昂的成本和竞争风险。
更重要的是,尽管最近投资者对AI充满热情,但初创公司面临的融资环境比上一代更为严峻。风险投资、私募股权和并购数据库PitchBook的数据显示,今年上半年,AI芯片初创公司获得的风险投资仅略高于10亿美元,作为比较,2021年的融资额高达95亿美元。
此外,这些初创公司还面临着进入停滞阶段的技术复杂性和高昂成本挑战,还需要将设计完成并交付给台积电等制造商尽快投产。尽管如此,创始人和投资者都认为,生成式AI将使计算领域产生翻天覆地的变化,这足以使他们从英伟达身上分一杯羹。
国内GPU企业也在发力
国际大厂竞争的同时,本土GPU厂商也在积极行动。事实上,本轮市场下行对本土GPU厂商来说,既有压力也是机遇。在“东数西算”工程的支持下,近年来国内涌现出一批GPU企业。2022年12月20日,天数智芯举行发布通用GPU推理产品“智铠100”。根据天数智芯产品线总裁邹翾介绍,智铠100产品卡,可提供最高384TOPS@int8、96TFlops@FP16、24TFlops@FP32的峰值算力,相较于市场上现有主流产品,智铠100将提供2-3倍的实际使用性能。而此前,壁仞科技发布的通用GPU BR100,16位浮点算力达到1000T以上、8位定点算力达到2000T以上。芯动科技发布的“风华2号”GPU,像素填充率达48GPixel/秒,FP32浮点算力1.5TFLOPS,性能领跑国产桌面、笔记本电脑和工控机赛道。
对此,芯动科技首席GPU科学家杨喜乐指出,现代GPU的涉及面广泛开发应用方面有很多技术壁垒,对开发团队能力要求很高;要拿出一款对标行业先进水平且流畅兼容各种应用的图形GPU,需要具有跨多领域平台能力和大量流片交付经验的复合型技术团队,要不断进行GPU底层技术、算法架构和软硬件创新。GPU行业已经形成稳定的垄断格局,市场下行对本土GPU厂商来说,必将承受更多压力,但也将为本土GPU厂商提供新的发展机遇。