10月17日,美国加强了面向中国市场的AI芯片禁令。其中明确将性能、密度作为出口管制标准,将单芯片超过300teraflops算力,以及性能密度超过每平方毫米370 gigaflops的芯片都纳入了禁止出口行列。
虽然在这一禁令下,AMD、英特尔等公司提供的高端AI芯片也受到影响。但由于英伟达在全球AI芯片领域一家独大,本次禁令涉及A100、H100等主流AI训练用英伟达GPU,因此这次的芯片禁令也被称为“英伟达禁令”。
消息一出,立刻引起了AI产业的热议。但讨论大多集中在禁令何时施行,是否有缓冲地带,具体涉及哪些GPU型号,禁令期限是多久等。这就导致一个显而易见的宏观背景被忽略了:自贸易摩擦发生以来,中美经贸关系虽然时有波动,但面向中国的芯片管控却始终有增无减。尤其是高端AI芯片禁令,在诸多争议中依旧被坚定推行。
至此,AI行业似乎已经必须形成一个基本的共识:抛弃幻想,准备斗争。
与其斤斤计较哪些GPU被禁,是否有解禁可能。不如重新审视在芯片铁幕时代下,中国AI计算究竟何去何从?
本文希望从目前的产业局面出发,和大家一起思考AI计算的前行之路。
目前的局面
首先我们必须了解一个问题,那就是为什么这次英伟达禁令出台之后,大众舆论与AI行业的反应都没有18、19年芯片封锁刚开始时严重。似乎只有在消费级显卡RTX 4090是否被禁问题上,引发了游戏玩家和相关商家的一些争论。
这背后的宏观逻辑在于,行业是非常不愿意看到高端AI芯片被禁售的,但其实也对这种局面早有预料。一方面是美国对华芯片封锁推动多年,此前英伟达部分高端GPU已经被禁,产业界的反馈早就从惊愕调整为了泰然处之。加上ChatGPT爆火之后今年全球高端GPU行情陡然看涨,随之而来的是美国方面屡次表态要推动对华整体性的高端AI芯片禁售。虚虚实实几个月之后,最终落下一锤也不外如是。
为了应对这次可预见的禁令,同时也有大模型发展的客观推动,去年年底到今年上半年大量中国科技、金融、汽车等领域的企业集中囤货英伟达高端GPU,已经造成了市面上一卡难求的局面。换句话说,对于很多中国中小型科技企业、AI创业公司来说,高端GPU本就买不到,禁售之后并没有太多改变。
另外一个真实情况是,高端AI芯片并非无法国产化。早在18、19年贸易摩擦开始之后,国内AI芯片产业加速发展。这就导致在AI训练需求上,英伟达高端GPU虽然很难被替代,但并非不可替代。
加上AI芯片并不像手机芯片那样事关大众消费者,且华为已经在手机芯片上完成了突破。种种迹象合在一起,导致无论是大众还是行业,都对这次禁令产生了一种坦然,甚至有点见怪不怪的心态。
但必须客观看到的是,这次禁令绝非对中国AI行业没有伤害。一方面短期内更换英伟达GPU,无论在芯片产能、生态兼容性等问题上都非常困难。并且禁令还将直接在AI服务器等领域,给大规模使用英伟达产品的厂商造成伤害。
而更关键的问题在于未来,如果禁令长期存在,中国AI计算将逐渐与全球高端芯片脱钩,那么可能带来的长期负面影响是非常复杂的,比如说:
1.英伟达高端GPU代表的AI芯片在更新迭代之后,是否会造成中国AI算力的发展脱节?
2.底层算力出现发展分歧后,中国AI产业是否会在大模型等软件技术发展中掉队?
3.本次AI芯片禁令,已经呈现出大规模封锁的特征。这种科技封锁真的只会停留在AI芯片领域吗?通用算力、存储、基础软件等数字化基础能力是否将成为接下来的打击目标?
总而言之,这次的AI芯片禁令,对中国来说是一次有准备的博弈,而非一场奇袭。想要成功度过这一关,也需要将手中的每一张牌都打好,打出配合,从而降低伤害烈度,提升长期发展的胜率。
而就目前来看,中国AI计算有三项必须同时发力的“突围方案”。
方案1:用好“买家”身份
有个简单的道理,商业市场的行为逻辑是由供需决定的。但在以芯片为代表的中美科技贸易中,我们经常会陷入一个思维误区:认为绝大部分游戏规则是由美国政府和企业制定的,他们想卖我们就买,他们不想买我们就无奈。
作为全球芯片市场的最大“买家”,中国企业却没有话语权,这是非常荒谬的。
事实上,针对中国市场的AI芯片禁令,最直接伤害的就是以英伟达为代表的美国科技巨头。目前,英伟达AI芯片方面最大市场需求来自中国。此前英伟达CEO黄仁勋就明确表示,“如果被剥夺了中国市场,我们是没有应急措施的,世界上没有另一个中国”。
在这种情况下,我们能看到追求商业利益的美国科技公司,与追求政治利益的美国政府之间有着鲜明的矛盾。美国科技企业总是想方设法寻求反对禁令和绕过禁令,比如英伟达就从去年开始推出了应对禁运政策的中国特供版GPU。
中国市场,消化了美国科技企业约三分之一的产能,二者之间的供需纽带是无法长期割裂的。面对美国愈发明显的整体性科技封禁,中国市场也应该积极用好“买家”身份,让自身的行为更具鲜明立场与可预测性。
避免造成一种“卖了就欢迎,不卖只能无奈”的表现和印象。
“买家身份”应该是一种有立场、有力量且会愤怒的身份。
方案2:以云代卡,算力集中
在可见的较长时间里,美国对中国的AI芯片封禁恐怕都只会加强,而这个时机恰好对应上AI大模型发展的关键阶段。很多业内人士认为,大模型发展虽快,但没有呈现出此前其他科技风口的迅猛局面,投资缺钱,计算缺卡是主要原因。
那么如何解决中国AI产业在禁令之下的算力缺口问题呢?首先的应急方案就是企业加大云端AI算力的配置和投入,推进以云代卡。
事实上,在高端AI芯片可能被禁的大趋势下,中国几大公有云厂商都做出了加强囤积英伟达高端GPU的动作。这一方面是因为云厂商自身要加大大模型投入,打开MaaS市场,所以对AI算力有直接需求。另一方面也是因为GPU转化为云资源池之后可以长期复用,对于云厂商来说是一个进可攻,退可守的局面。因此,今年上半年一度出现了市面上高端AI芯片全都流向云厂商,中小企业一卡难求的局面。
客观来看,这种高端AI芯片集中向云的举动,对整个中国市场统筹应对AI芯片禁令是有利的,并且也符合东数西算的战略思路。
另一个利好云端AI算力的趋势在于,随着大模型参数和使用数据量的不断加大。本地化的卡池训练已经愈发吃紧。必须在云端发生的千卡、万卡训练成为未来主要的发展方向,因此企业用户天然会更积极走向云端。
同时,云端AI算力也不会仅仅停留在囤积英伟达GPU的层面。接下来,国产的自主AI算力驶入云端是大势所趋。在相关政策的推动下,云厂商正在加大自主AI芯片的采购力度。根据IDC数据,2023年上半年中国AI服务器已经使用了50万块自主开发的AI加速器芯片。在自主AI算力的服务化方面,华为云已经推出了昇腾AI云服务。云端化与自主化结合的AI算力,将在AI芯片禁令背景下得到极大发展。
加上近些年在东数西算大背景下,各地陆续建立了大量采用自主AI算力的AI计算中心,整体来看中国的云端AI算力是供给稳定、保障可靠的。
而很多企业依旧倾向于采购本地AI算力。这一方面是因为英伟达GPU市场紧缺,保值性特别好,甚至能作为企业的核心资产。另一方面是因为云端AI算力往往会有排队、宕机、软件服务缺失等问题。
如何进一步提高开发者的云端AI算力使用体验,是公有云厂商接下来需要发力的方向。
方案3:让国产AI算力爆发式成长
面对新一轮AI芯片禁令,中国AI产业最大的底气是什么?是多年之后的习以为常,还是大量屯卡之后的家有余粮?都不是。最关键的节点在于经过多年发展,中国AI芯片产业已经得到了巨大发展。英伟达的高端GPU确实依旧重要,但已经不是毫无替代选项可言。
根据IDC此前发布的数据,2022年中国AI加速卡出货量约为109万张,其中英伟达市场份额达到了85%,华为昇腾实市场占有率10%,百度昆仑为2%,寒武纪和燧原科技均为1%。
从中可以看出,国产AI算力已经实现了一定程度的市场占比,而不仅仅是概念与理论中的“纸上谈兵”。同时也应该看到,国产AI芯片在核心性能、软件生态以及出货能力上依旧不理想,还有很长的路要走。在英伟达禁令的客观条件倒逼下,国产AI算力必须在短期内跨越这些困难,加速自身的成长与成熟周期。
为了实现这个目标,有几件事非常重要:
1.形成产业共识,避免概念混淆。
提起AI芯片,我们经常会说它有非常多的实现方式,有很多自主品牌参与这个市场,看上去一片繁荣。比如AI芯片有GPU、FPGA、ASIC、存算一体和类脑芯片等,国产AI加速芯片厂商有阿里、百度、华为、寒武纪、海光信息、燧原科技、天数智芯、壁仞科技、摩尔线程、龙芯中科等。
这种“繁荣”的表述,不仅在大众舆论和投资市场上具有迷惑性,还经常出现在一些行业报告与政策分析当中。但其中蕴藏的问题在于,普遍过分拓展了AI芯片的定义。比如说,类脑芯片在可见的未来中都仅仅是技术畅想,如果每次讨论国产AI芯片都把类脑加上,那只会浪费时间,分散精力。再比如,有些AI芯片厂商只能做自用芯片,无法面向市场出货。有些厂商目前还不具备商业化能力,处在早期建设阶段,他们短期内对于AI计算自主化的贡献也就非常之小。
为了应对英伟达高端GPU禁售问题,我们需要把目光集中在可行、有效的GPU替代品上,而不是进行过多联想和发散。只有形成了这一产业共识,才能聚集力量解决问题。
2.走向规模化商用,避免PPT造芯。
事实上,无论从AI加速芯片还是服务器整机来看,国内目前能够出货的AI芯片厂商都寥寥无几。主要集中在华为、百度两家,燧原科技、海光信息也有一定的出货。而大量半导体厂商与AI企业,更多还停留在打造芯片的计划与愿景上。这就导致大量受到政策支持与投资市场期待的国产AI芯片停滞不前,甚至有停留在这一阶段享受金融市场红利的嫌疑。
接下来的产业导向,应该从AI芯片的立项走向出货,帮助AI芯片厂商获得直接的商业回馈,产品与产能接受市场检验,逐步塑造正向的现金流。
3.加强软件生态,强化迁移能力。
英伟达GPU之所以重要,不仅在于硬件性能,更在以CUDA、PyTorch为核心的软件生态能力,因此发展国产AI芯片绝不能低估软件的能力。在强化自主软件生态建设的同时,也要重视基于英伟达生态打造AI模型的迁移能力与迁移成本。
为此,已经有大量厂商进行了探索,比如海光信息的DCU,就在生态、编程环境等方面与CUDA高度相似,CUDA用户可以以较低代价快速迁移至海光的ROCm平台。而在此前,PyTorch2.1 版本宣布支持华为昇腾。可见国产AI芯片已经具备了一定的规模化影响力,可以更多融入全球软件生态当中。
未来想要实现国产AI计算的爆发,是无法离开国产AI基础软件生态爆发的。
4、加大对“主品牌”支持,形成规模化效应。
对于美国AI芯片,除了英伟达GPU,你还知道哪些?这个问题即使是问一些AI开发者,答案也很大程度是不清楚,或者没试过。从中可见,AI计算就像通用计算、图形计算一样,极大概率是会最终出现一到两个“主品牌”的。这属于客观的市场规律,没有必要以揠苗助长的方式实现“百花齐放”的局面。
甚至就目前中国AI计算必须加速成熟,完成自主化替代的目标来说,尽快实现一超多强的局面是件好事。这可以避免生态割裂,避免产业在摇摆形成大量IT投资浪费。这个过程理应交给市场选择,慢慢成型。但在芯片禁令的大背景下,国产AI计算崛起已经时不我待,与其让100种AI芯片慢慢成熟,慢慢洗牌,比如加速形成“主品牌”快速替代的局面。
而从目前局面看,昇腾是最有可能成为国产AI算力主品牌的一支力量。科大讯飞创始人、董事长刘庆峰此前表示,华为GPU已经对标英伟达A100。根据数据显示,昇腾310整数精度算力达到了16TOPS,昇腾910整数精度算力达到640TOPS。这意味着昇腾910性能已经接近英伟达A100。
同时,昇腾也是目前唯一稳定占据市场份额的国产AI算力,并且在软件上孵化了类似英伟达CUDA的异构计算架构CANN和AI计算框架MindSpore。在核心性能、软件生态与市场占有率三项指标来看,昇腾都已经具备了可以加快成长,实现AI算力大规模国产化替代的可行性。
规范行业标准,强化软件建设,提高自主品牌支持,是短期内推动国产AI算力快速成长的主要途径。
英伟达禁令,是一个中国AI行业普遍不愿意看到,尽量避免,甚至到今天也有些讳莫如深的问题。但形势比人强,在不断加速的逆全球化进程与AI竞赛中,类似禁令未来大概率只多不少。
逃避、迂回、噤若寒蝉,都无法解决问题,只有坦然应对,奋力自强,才能从根本上解决受制于人的问题。
禁令之下,中国AI计算何去何从?
答案是我们已别无选择,所以要给世界第二个选择。