据彭博社报道,OpenAI 首席执行官山姆·奥尔特曼 (Sam Altman) 正在筹集资金建设半导体生产设施,生产用于人工智能 (AI) 应用的处理器 。他相信人工智能技术将在未来几年变得足够普遍以支持他们自己的半导体供应链。报道称,这家合资企业未来可能将与英特尔、台积电和三星代工等公司竞争。
根据2023年10月份发布的一份报告显示,OpenAI 目前在其流行的 Chat GPT 服务中主要使用的是 英伟达(Nvidia) 的 A100 和 H100 GPU。英伟达占据全球人工智能处理器市场 80% 以上的份额。
一段时间以来,OpenAI也一直在探索开发自己的 AI 处理器的方法。而OpenAI设计自己的人工智能芯片,也将符合亚马逊AWS、谷歌、微软和许多其他超大规模企业自研AI芯片的趋势,除了购买现成的产品外,巨头们更喜欢构建符合自身需求的定制处理器。另一个好处是,自研芯片将可以帮助巨头们摆脱对于英伟达等少数AI芯片供应商的依赖,提升供应链安全。
Altman此前也曾表达了他对 GPU 短缺以及在此类平台上运行人工智能软件所需的巨额费用的担忧。因为仅 ChatGPT 的运营成本就非常巨大。
根据Bernstein Research资深分析师Stacy Rasgon分析,ChatGPT每次查询的成本约为0.04美元,如果ChatGPT查询量成长至谷歌搜索规模的十分之一,最初需要部署价值约481亿美元的AI芯片投入运算,每年还需要价值约160亿美元的芯片才能维持运作。
显然,如此巨额的芯片采购成本投入,完全能够支撑OpenAI自研芯片的需求。但是,Altman似乎想做一些不同的事情,正如 彭博社 所描述的那样,建立一个“人工智能芯片工厂网络”。据悉,OpenAI拟筹建的合资企业与总部位于阿布扎比的 G42 和软银集团等潜在投资者进行了讨论,旨在解决当前和预期的人工智能相关芯片供应短缺问题。显然,Altman 认为台积电、三星代工和英特尔代工服务等老牌代工厂将无法满足未来几年对人工智能芯片的需求。
芯片初创企业:初生牛犊不怕虎
除了这些传统的芯片行业巨无霸,风险资本投资者今年也在芯片行业押下了数十亿美元的赌注,希望借此进军这个新兴市场。AI芯片初创公司Mythic和Tachyum在经历了几年的投资后,今年筹集到了新的巨额投资。
Crunchbase的数据显示,芯片初创公司在2021年吸引了83亿美元,在2022年吸引了79亿美元,虽然这些数字也不算少,但落后于其他热门行业,如加密行业。不过在今年,许多科技领域风险投资者的眼中,几乎只有AI。
英伟达的领先优势也并没有让新来者气馁。
英国Graphcore公司已经从投资者那里筹集了7.5亿美元,其首席执行官Nigel Toon表示,为了与英伟达竞争,Graphcore公司正在开发一款更强大的人工智能处理器。
Toon指出,Graphcore在亚洲尤其成功。由于地缘政治紧张局势加剧,美国当局限制英伟达向中国销售最先进的芯片,中国企业一直在寻找美国供应商的替代品。
“英伟达需要分享出他们的一部分市值,”Toon调侃称,他指的是英伟达市值上月首度跻身的“万亿美元俱乐部”。
半导体产业向中国转移,国产AI芯片迎来新机遇
全球半导体产业发展至今,总共有三次转移历程。第一阶段:由美国转移到日本。日本从装配开始全面学习美国半导体技术,电器时代向PC时代转变;
第二阶段:由美国、日本转移到台湾、韩国。日本芯片产业受美国施压及本土经济乏力而衰落。PC时代持续繁荣;
第三阶段:由美国、台湾、韩国转移到中国。中国芯片产业拥有巨大下游市场,劳动力丰富,且背靠国家产业政策和活跃社会资本的支持。PC时代向万物互联、人工智能时代转变,激发对AI芯片的需求。
2019年全球AI芯片市场规模为110亿美元。随着人工智能技术日趋成熟,数字化基础设施不断完善,人工智能商业化应用将加速落地,推动AI芯片市场高速增长,预计2025年全球人工智能芯片市场规模将达726亿美元。
AI PC、AI Car、AI Phone成最热板块
淘金先富卖铲人,背后的AI芯片厂商已经摩拳擦掌。分行业来看,AI PC、AI Phone、AI Car是其中关注度最高的三个板块。
AI Phone:亟待AI拉动新增量
过去几年时间里,手机处于增长乏力的状态,即便厂商在硬件上「卷」到了极致,仍难以掩盖创新缺失的残酷真相。除了华为mate 60横空出世给市场带来了一些新鲜血液,就连苹果的发布会都难以讲出说服消费换机的新故事。
AI是它唯一能拉动增长的发力点。「AI上机」的传说从ChatGPT向C端开放起就飘荡在市场的上空,被谈论了一整年。但在大模型向小型化发展之前,硬件与模型规模之间的矛盾几乎不可调和。
事实上在手机端,至今也很难在保证模型性能的情况下,避免手机发热、内存占用量过大等体验对消费者购买欲产生的影响。
年初,手机芯片双雄之一高通演示了在安卓上运行Stable Diffusion的效果,并在近期宣布将推理时间缩短到1秒以内,但另一雄的联发科工程师表示,本地运行13B体量的小模型就意味着需要占用约13GB的内存,再加上安卓本身的4G,在不下载任何其他App的情况下,就已经超过了大多数手机16GB的内存容量。
即便如此,市场仍为AI Phone领域的增长投下了赞成票。它们的理由是,手机是人们日常使用频率最高的电子产品,基于入口优势,虽然本地部署还存在一定的困难,但云端运行AI带来的增量仍不容忽视。分析机构Canalys预测,2024年全球智能手机出货量将在2024年恢复增长,增幅约为4%。
AI PC:硬件、框架之争
相比之下,AI PC的进展则顺利得多。理由也很简单,与手机相比,PC的体积更大,芯片性能的上升空间更广。IDC预测,2024年将成为AI PC快速发展的第一年,2024年整体PC市场AI PC占比将达到55%,而2027年将达到85%。
目前PC端的AI芯片厂商已经释放出了浓烈的火药味,彼此间的混战一触即发。
NPU与GPU之争是混战的第一个赛点。
GPU无需多言,关键是NPU为什么能站上擂台。与算力中心背靠成千上万台集成了CPU、GPU等各种芯片的服务器不同,PC的算力主要集中在一块「总芯片」当中,这块芯片由CPU、GPU、NPU等「分芯片」构成,各芯片分工不同。其中NPU就是专门被设计出来处理AI相关运算任务的。
因此,矛盾产生了。虽然GPU的定义是图形处理器,但同时它浮点、并行运算的特性也促使它成为了运行AI运算的最佳载体之一,这一点在云端已经被证明。一旦AI PC实现,大量AI运算任务势必带动GPU的销量。本次CES展开幕之前,英伟达连发三款消费级GPU,显然是向市场释放信号。
X86构架和ARM构架之争,是混战的第二个赛点。
X86和ARM是芯片的两种构架。X86构架是英特尔的代名词,在PC芯片端,直接与英特尔展开竞争的是采用ARM构架的手机芯片龙头高通和联发科。
X86和ARM的区别可以简单概括成前者性能、功耗双高,后者双低。过去,ARM一般被用于手机,但近年内,随着ARM芯片的性能不断提高,低功耗的优势正在引起业内玩家的注意。微软、苹果、Meta等厂商都在支持基于ARM的PC。据界面新闻报道,英伟达和AMD正在考虑2024年为移动PC提供基于ARM的解决方案。
高通对于AI PC垂涎已久,去年10月面对Windows 11发布的骁龙X Elite芯片与同级X86相比,性能可达竞品的两倍,而达到相同峰值性能时,功耗仅为竞品的三分之一。
AI Car:两大阵营跑马圈地
虽然AI PC的战场已经硝烟四起,但若是与AI Car相比,甚至能被称作一团和睦。背后的原因也很好理解,PC和手机是为存量市场里找增量,而车载AI则是实打实的蓝海。
「AI上车」同样有两个赛点,分别是智能座舱和自动驾驶。
在智能座舱领域,高通率先采用SoC逻辑设计车载MCU芯片的举措为它带来了先发优势,因此扮演着守城者的角色。眼下,它正面临着英伟达、联发科、英特尔等企业的多重围攻。
去年6月,联发科宣布将与英伟达合作,为下一代软件定义汽车提供全套车载人工智能座舱提供解决方案,覆盖从豪华到主流的所有汽车细分市场。
双强合作的模式是,联发科将开发集成英伟达GPU的汽车SoC。而英伟达则是目前高端车型主要采用的自动驾驶系统供应商,客户资源广泛。本次CES展中,英伟达公布了DRIVE系列汽车业务的最新进展,理想、长城、极氪、小米等企业均已采用DRIVE Orin平台为其智能自动驾驶系统提供支持。
英特尔亦在CES宣布了进军汽车行业的重要战略,推出专为下一代汽车设计的AI增强软件定义车辆系统芯片(SoCs)。其旗下的自动驾驶解决方案公司Mobileye一直处于世界领先的地位。
在自动驾驶领域,则呈现两强争霸的格局。英伟达与地平线分别包揽高端和低端车型,按覆盖车型价格区间的广度排名,地平线第一,英伟达第二。
与英伟达CUDA类似,地平线也有自己的生态护城河。同时,作为本土供应商,地平线在交付效率上更具优势。