科创板“AI芯片第一股”,又赶上了春天?
自2023年以来,寒武纪股价区间涨幅约260%,经过数天回调,截至4月18日收盘,寒武纪报195.78元/股,总市值811.74亿元。而在4月4日,寒武纪盘中股价一度达到230元/股,当日收报215.49元/股,相比开年的54.56元/股,累计涨幅近300%,总市值也达到864亿元,距离上市初的1200亿巅峰市值更近一步。
寒武纪再次被市场关注,最直接的原因是ChatGPT的横空出世,人工智能被推向资本的聚光灯下,市场对AI的期待值重新拉升,寒武纪也在这场行业春风中身沾雨露。
让寒武纪再度提振市场信心的,无疑是国产大模型爆发,市场预计将调用超大规模算力,或将引发算力缺口。作为AI训练芯片研发商,当英伟达新款大模型专用芯片A100被限制进入中国市场后,寒武纪面临着一个极佳的国产替代机遇。
“大模型”带动算力需求,寒武纪股价“第二春”
2023年,市场对ChatGPT进行了密切关注,国内券商研报曾引用OpenAI的测算信息,其中提到自2012年以来,全球头部AI模型训练算力需求3-4个月翻一番,每年头部训练模型所需算力增长幅度高达10倍。
随即,大模型或将引发算力缺口,厂商掀起算力军备的消息迅速扩散。
然而,大模型训练和推理的AI芯片却在中国市场告急。根据中国信通院的数据,2021年第四财年英伟达占据了全球95.7%的GPU算力芯片市场份额。但早在2022年8月,英伟达就受美方限制,对中国区客户断供高端GPU芯片,其中用于大语言模型训练的A100和H100赫然在列。
尽管英伟达为中国特供的A800理论上可以购买,但其价格却一路看涨,且“有价无市”。并且如此高的硬件成本,对于大模型研发企业亦是负担。
值得注意的是,在3月中旬,百度大模型文心一言发布之际,有网络传言称,文心一言将调用超大规模算力,并且尝试使用寒武纪思元590替代英伟达A100。尽管后来寒武纪进行了澄清,但也可以看出,市场正将目光转向国内AI芯片厂商。
如果说AI算力是大模型训练与产品运营核心基础设施,AI芯片则是AI算力基础设施的关键组成。国产大模型对上游AI芯片算力提出了更高的要求,AI芯片也迎来成长机遇。
作为科创板AI芯片第一股,寒武纪当前的主要产品线包括云端产品线、边缘产品线、IP 授权及软件,其中AI算力专用芯片是属于寒武纪云端产品线,目前主推的云端产品思元290和思元370及相应的云端智能加速卡系列产品、训练整机。
市场信息扰动二级市场,寒武纪于2020年7月20日登陆科创板,上市首日开盘价为250元/股,较发行价上涨近300%,盘中市值一度达到1200亿。然而,上市之后的寒武纪股价却一路下跌。2022年3月份,甚至出现盘中跌破发行价的情形。
从寒武纪股价走势可以发现,其股价的低迷持续了一年之久。在这期间,寒武纪股东也在频繁减持,因此,彼时市场对这家芯片独角兽企业出现了更多的质疑声。
但ChatGPT的出现,将寒武纪再次点燃。2023年,寒武纪股价区间涨幅超250%,总市值从200亿上升至800亿。
国产GPU正在缩短与巨头的差距
如果按照GPU的分类来看,目前GPU显卡主要分为AI/FP、渲染这么两类,其中AI是用于深度学习的加速卡,而FP是用在超算上的加速卡,这两类可以归为一类,都属于高性能的加速卡。
而渲染类的就是普通的大家熟悉的显卡,用于游戏、以及各种图形化应用的。
从市场来看,2022年,国内GPU市场,基本上被NVIDIA、AMD、INTEL这三大厂商占领,份额超过95%,国产GPU份额不至5%。
其实国内的GPU厂商并不少,随便一数都能够数出10多家来,比如景嘉微、摩尔线程、芯动、兆芯、天数智芯、壁仞、芯原、登临、瀚博、燧原、芯瞳、沐曦集成等。
但大家会发现,这些厂商更多发力的还是渲染这一块,也就是用于游戏、以及一些图形化应用上。而在AI/FP上,发力的少,虽然也有璧仞科技、芯瞳半导体、天数智芯、沐曦集成电路等几家厂商,但大家与AMD/NVIDIA的高端GPU相比,还是有差距的。可以负责任地说,现阶段国产GPU大多还不具备支撑大模型训练所需的能力。
此外,GPU比拼的不仅仅是硬件,还有软件生态,比如各种图形API和计算接口、基础库、与上层应用对接适配等等,而像AMD\NVIDIA这两家厂商,经过了几十年的发展,已经形成了较强的生态效应,国产GPU在这一块差距更大,需要较长时间来完善,这些也阻碍了国产GPU的发展和应用。
那么我们就这样认输了?当然不是的,这几年,在国内政策端对关键基础设施自主可控的重视下,社会上对于国产替代的意见逐渐达成一致,坚定了“自主研发代替购买”的信念。国产GPU可谓“天时地利人和”,未来有着无限可能。
目前,不管是政策,还是从国产替代的市场需求等来看,国产GPU厂商迎来了真正的发展机遇,同时众多原本在美国从事GPU产业的高端人才,也纷纷回国创业,想要研发出自己的GPU出来。
比如由英伟达中国区前负责人张建中在2020年创立的摩尔线程;由 AMD 中国前图形研发高级总监陈维良创立了沐曦,还有壁仞科技的CEO李新荣,他在AMD就职了15年……
虽然国产CPU在纯硬件性能方面较AMD/NVIDIA有差距,但国产厂商们,也不断的进行迭代,推出了自己的产品,极力缩小与AMD/NVIDIA的差距。
此外,这些厂商也在走另外一条路,那就是推出自己的云端GPU产品,用云端训练、云计算来弥补差距。比如燧原科技、壁仞科技、天数智芯、寒武纪等公司都类似的产品。
还有像海光则推出了DCU(协处理器),其性能已经达到了NVIDIA A100的60%左右。百度用自研的昆仑芯片来替代GPU芯片,还有华为用昇腾910来替代GPU。
还有中国电信天翼云则研发了基于紫金DPU的新一代云计算体系架构,实现对计算、网络、存储等算力资源的快速云化加速,具备高性能、低延迟、高可靠、可大规模部署的特点,在2022 SmartNIC&DPU Awards年度评选中荣获匠芯技术奖。
同时在信通院的标准化测试中,中国电信天翼云更是成为获得GPU性能优秀奖的六家企业之一。
可以说,虽然国内通用GPU产品与国际旗舰产品相比存在差距,但大家不断努力,产品和路线相结合,通过另外的一些方式,一定程度上而言,国产GPU已经有了不弱于国外GPU产品的实力。
大模型出现带动AI服务器呈现加速状态
国产生态迎新机遇
除了对低延迟低功耗算力的性能需求,在服务器的种类上也产生了多样化、细分化的场景应用需求。各行业与人工智能技术的深度结合及应用场景的不断成熟与落地,使人工智能芯片朝着多元化的方向发展,为了迎合芯片的多元化,服务器的类型也将越来越丰富,并适用越来越多的行业应用场景。根据IDC在2021年的统计,预计到2025年中国加速服务器市场规模将达到108.6亿美元,且2023年仍处于中高速增长期,增长率约为20%。
X86架构服务器仍占绝对优势,ARM架构服务器潜力巨大:根据市场应用占比把服务器分为X86服务器和非X86服务器,目前使用X86架构的服务器CPU仍然占据绝对优势。根据芯八哥数据,按照2021年统计数据,X86架构市场占比高达97%,ARM占比仅为2.07%,Power BI占比为0.27% ,但以ARM为代表的RISC结构近年来增长迅猛,尤其国内诞生了以华为海思、阿里平头哥为代表芯片企业。
X86和ARM各具优势:ARM体积小、低功耗、低成本、执行更加高效、指令长度固定,然而在性能上不及X86,如果ARM要在性能上接近X86,就需要极高的频率,从而带来较高能耗;X86单条指令功能强大且指令数相对较小、带宽要求低,然而缺点在于寻址范围小、部分计算机利用率不高、执行速度慢。
ARM加速迭代,国产生态迎新机遇: 根据TrendForce预测,随着云数据中心增长,预计到2025年,ARM架构在数据中心服务器市场渗透率将达到22%;ARM在服务器的市场崭露头角,早在2008年高通、博通、微软、华为、飞腾等,也陆续开发了各自的ARM服务器CPU,2019年,随着着ARM的Neoverse平台路线图的推出,服务器市场份额渗透率得到质的提升;国产生态迎新机遇,X86生态依然被AMD和英特尔垄断,而ARM架构随着国产生态和技术逐渐成熟,迎来国产替代的新机遇。