瑞银(UBS)在最新发布的一份报告中表示,科技行业刚刚开始大规模增长周期,预计到2027年,随着人工智能在各经济体中的广泛应用,AI模型及应用程序将成为一个2250亿美元的细分市场。2022年的22亿美元,将成为这一数字的零头。
显然,这是一个巨大的飞跃,因为这意味着将近152%的复合年增长率。此外,研究人员还承认,瑞银此前关于AI行业总收入增长的预测可能过于保守,因此此次将AI行业总收入上调了40%,预计AI行业总收入将增长15倍,从2022年的180亿美元增加到2027年的4200亿美元,复合年增长率将达到72%。
这些增长将主要来自两个市场。一是软件市场。报告称:“如果ChatGPT应用程序的推出是人工智能行业的‘iPhone时刻’,那么在我们看来,最近推出的众多应用程序,如微软的Copilots,以及OpenAI在23年第四季度推出的Turbo with vision,意味着人工智能行业的App Store时刻已经到来”。
另一个则是在GPU云和人工智能边缘计算等新兴趋势推动下,正在快速成长的人工智能基础设施市场,这个细分市场的规模预计将从2022年的258亿美元增长到2027年的1950亿美元,推动AI成为全球科技领域未来十年的科技主题,“因为我们在其他科技领域没有看到类似的增长情况”。
AI大模型推动智能算力需求大爆发
如同农业时代的水利,工业时代的电力,算力是数字经济时代的关键生产力。随着AI步入“大模型”时代,算力的提升也被加速推动。
这是因为AI非常依赖相关基础设施,包括计算、储存和网络等,并且随着人们对AI性能要求的提升,训练AI所需要用到的数据不断增长,算法的复杂度也在不断提高,因此对于算力也提出了更高的要求。
截至2023年6月底,我国在用数据中心机架总规模超过760万标准机架,算力总规模达到了197EFLOPS,位居全球第二,算力总规模近五年年均增速近30%。
随着AI向多场景化、规模化、融合化等高应用阶段发展,其所对应的数据体量、算法模型参数量以及以加速计算为核心的算力中心的规模将不断增大。
而AI芯片作为面相人工智能领域的芯片,是专门用于处理人工智能应用中大量计算任务的模块。“无芯片不AI”,AI芯片兴起于AI对算力的高需求,以其为载体实现的算力是人工智能发展水平的重要衡量标准,因此,我国AI芯片行业的发展备受关注,不断涌现出新的生产设计商,市场规模也正不断扩大。
云端+终端需求推动芯片加速拥抱AI
从云端需求来看,大语言模型仍然将是主要的增长点。同时,图像生成类模型也会保持快速增长的势头。具体来说,大语言模型仍然是各大科技公司竞相研发的核心技术,包括OpenAI,微软,谷歌,华为,阿里巴巴,百度等中外科技公司都在大力研发下一代的大语言模型,而包括中国移动等传统行业的公司也在入局大语言模型领域,同时还有大量的初创公司在依靠风险投资的支持也在大力开发大语言模型。大语言模型的百家争鸣时代才刚刚开始并且远远没有落下帷幕,在这样的群雄逐鹿的时间节点,预计对于芯片的需求也会快速增长。大语言模型的特点是需要海量的数据和训练芯片资源,而且同时由于格局尚未尘埃落定有大量的公司在研发新的模型,因此总体来说训练芯片的需求会非常大。
而随着云端人工智能交互进入多模态时代,聊天机器人已经不仅仅可以用文字回答,而且还可以完成看图说话以及图像甚至视频生成等任务,因此我们认为,图像生成类的模型,以及图像和语言结合的多模态模型也将会成为云端人工智能的一个重要增长点。
除了云端市场外,我们预计人工智能对于终端市场也有更强的需求,这也将推动人工智能成为终端计算芯片中越来越重要的差异化元素。
在手机端,人工智能的使用频率将会进一步增强,这也会推动芯片加入更多相应的算力,并且将人工智能支持作为SoC的核心亮点。例如高通发布的Snapdragon 8 Gen 3就以“低于一秒的延迟实现图像生成任务”作为一个重要卖点,估计这样的人工智能能力将会深度集成到手机厂商的操作系统中。除了高通这样的第三方芯片公司之外,自研手机芯片的系统厂商预计也会继续加码人工智能;苹果虽然在这方面保持低调,但是预计在未来会以各种方式(加大NPU算力,或者是加大软件支持)的方法来开始赋能更多人工智能在iPhone上的新拍摄用户体验。vivo在自研ISP芯片领域已经有了数年积累,而目前生成式人工智能对于拍摄体验的提升恰好和ISP有很强的协同作用,这也是2023年8月vivo发布的v3 ISP芯片强调了生成式人工智能作为一个核心亮点。未来,预计会看到越来越多这样的芯片强调人工智能对于用户体验上的赋能作用。
在智能汽车领域,Nvidia虽然不如在云端强势,但是其Orin系列芯片仍然是各大车厂考虑的标准芯片模组。我们认为,随着人工智能大模型对于智能驾驶的赋能作用逐渐加强,无论是第三方芯片还是车厂自研的芯片都将会进一步强化对于人工智能算力的投入,同时也推动芯片性能的快速提升——最近,无论是蔚来发布新自研芯片的算力规格,还是特斯拉传出将使用TSMC 3nm作为下一代芯片的生产工艺,都在提示着我们2024年人工智能将在智能车芯片领域扮演越来越重要的角色。
出口限制的另一面
国产替代迎来新机遇
美国当地时间10月17日,美国商务部工业和安全局(BIS)发布了针对芯片的出口禁令新规,对于中国半导体的制裁进一步升级。此次限制的核心对象是先进计算半导体、半导体制造设备和超级计算机项目。而此次新规事实上是美国对2022年10月7日发布的规则进行修改更新的版本,更加严格地限制了中国购买重要的高端芯片。
与此同时,从另一个角度来看随着英伟达、英特尔等芯片的进口受到阻碍,也将在某种程度上促进国产GPU的发展。
以华为为例,华为昇腾芯片包括昇腾310和昇腾910,前者的整数精度算力可达16TOPS,主要应用于边缘计算产品和移动端设备等低功耗领域;后者整数精度算力可达640TOPS,性能水平接近英伟达A100。此外,华为近期也发布了新一代昇腾计算产品,推出全新架构的昇腾AI计算集群——Atlas 900 SuperCluster,可支持超万亿参数的大模型训练。
此外,寒武纪的芯片,也被用于国内某短视频平台,训练参数量约为1000亿的大模型;今年6月10日,天数智芯对外宣布,在天垓100加速卡的算力集群,基于北京智源人工智能研究院70亿参数的Aquila语言基础模型,使用代码数据进行继续训练,稳定运行19天,模型收敛效果符合预期,证明天数智芯有支持百亿级参数大模型训练的能力。
可以预见的是,新的出口管制措施有可能催生国产AI芯片发展的加速,由于中国的企业将面临寻找替代供应商或自主研发替代产品的压力。这将助力推动国内芯片产业的技术进步和创新能力的增强,逐渐减轻对外国技术依赖的程度。