前有苏妈站台三星,后有老黄力挺联发科?
2022年 11 月,联发科和高通接连发布了新一代旗舰芯片——天玑 9200 和骁龙 8 Gen 2,除了性能上的提升,两场发布会上最大的功能亮点都是对移动光追技术的支持。光追对画面显示效果的提升,早已被桌面玩家认可,但同时,外界也对两款手机芯片的光追性能以及能效保留了疑问——先不说能效表现,在实际游戏中,手机 GPU 能跑多久?不知道。
包括号称首发移动光追开放平台的一加 11,也根本没准备好正式迎接手游光追。即使在目前手游比较普遍的 720P 清晰度下,光追对手机 GPU 的性能和功耗压力依然很大,如果说高通那边还可能依靠自研 GPU 架构再挤一管「牙膏」,联发科这边最好的选择就是:摇人。
据 DidiTimes 援引芯片设计人士报道称,正在冲击高端市场的联发科将与英伟达进行合作,预计最快将在 2024 年联发科的旗舰芯片上搭载英伟达 GPU,强化联发科芯片的 AI 和游戏性能。
而除了联发科,其他几家手机芯片厂商也在加强 GPU 方面的性能,以应对移动光追以及 AI 等方面的性能需求。三星携手 AMD 早在去年就推出了支持光追的芯片,高通也将继续发力自研 GPU 架构,苹果原计划在 A16 上的采用新一代支持光追的 GPU 架构也即将到来。
未来几年,随着各家对移动光追的落地,我们很可能将看到苹果、高通、联发科、三星、英伟达、AMD 以及 Arm——七家全球半导体巨头在手机 GPU 领域的对决盛景。
1、手机 GPU 大战在即
理想情况下,联发科可以借由英伟达在 GPU 上的理解和技术实力,一举拉近与骁龙旗舰芯片、苹果 A 系列在 GPU 方面的差距,甚至是超越,进而联发科也有望抢到更多的高端手机芯片市场份额。
当然,实际层面还是有太多可能因素影响。
去年年初,三星发布的旗舰芯片 Exynos 2200,其中就搭载了基于 AMD RDNA2 架构开发的 GPU,首发支持移动光追和可变速率着色等高级图形处理功能。
但从后面 Exynos 2200 的表现来看,三星和 AMD 的首次携手显然谈不上成功,能效远低于外界预期。在今年最新一代旗舰手机 S23 系列上,三星甚至在全球范围内转向高通骁龙平台,Exynos 平台则转而服务三星自家的中端或入门级产品。
不过,三星和 AMD 并没有因为第一次的失败而放弃继续合作。至少三星明确表态将继续在 Exynos 上与 AMD 合作,基于 RDNA 架构开发 GPU。此外,还有消息指出三星成立了一个名为「梦之队」的研发小组,目标是在 2025 年开发出具有竞争力的移动处理器,最终计划在 Galaxy S25 系列上搭载。
另一边,AMD 入局手机 GPU 市场,英伟达更是在 Tegra 之后再度重返,一是看到了未来 ARM 架构在高性能芯片市场的可能带来的变局,二是智能手机作为全球最大的游戏平台的巨大利益,完全可能弥补 PC 市场萎缩留下的巨大缺口。
上周,英伟达公布了 2022 年第四季度及全年业绩报告,游戏和数据中心依然是英伟达最核心的两大业务。全年来看,数据中心(含 AI)业务营收达到了 150.1 亿美元,同比增长 41%;游戏业务营收 90.7 亿美元,同比下滑 27%。
不仅是财报亮眼,最近两个月火爆全球的 ChatGPT,也让主导 AI GPU 市场的英伟达的市值从年初至今涨了近 2000 亿美元。也怪不得过去两年英伟达创始人兼 CEO 黄仁勋多次在公开场合表示,「英伟达不是一家游戏公司,而是一家 AI 公司」。
就在最新的财报电话会议上,英伟达也是满口都是 AI,一位网友做了粗略的统计:5 分钟内,英伟达提了 23 次「AI」。
与此同时,全球 PC 市场的继续萎缩对于 AMD 和英伟达的游戏业务始终都是一个压力。去年前三个季度,英伟达游戏业务收入就经历了过山车一般的下滑。与联发科的合作,有可能将英伟达带向一个远大于 PC 市场的智能手机市场。
但留给英伟达和 AMD 的问题是,他们必须证明自己的价值——帮助联发科和三星在 GPU 性能和能效方面,追上甚至超越拥有自研 GPU 的高通和苹果。
2、高通和苹果:两座大山
相比其他手机芯片设计厂商,苹果和高通长期以来处于手机 GPU 领域的领先地位。很大程度上,这要归功于自研 GPU 架构带来的好处,不仅让苹果和高通打造一系列专属的特性和功能,形成差异化优势,也可以自行规划 GPU 的发展方向,掌控产品的更新节奏。
比如高通从 2018 年的骁龙 845 开始就推出了异构计算的人工智能引擎 AI Engine,通过 CPU、GPU 和 DSP 三方协同的方式实现顶尖的 AI 处理功能。
而从高通骁龙 865 旗舰芯片开始,骁龙 Elite Gaming 特性开始包括 Adreno GPU 驱动更新。这让手游也可以像桌面游戏一样,可以由玩家自行掌控图形驱动更新和 GPU 设置,享受最新的游戏特性体验。
但 Adreno GPU 也不是凭空而生的,高通 Adreno 技术其实来源于 ATI Imageon 系列低功耗 GPU。2006 年,AMD 收购了处在低谷的 ATI 公司。然而当时的 AMD 资金并不充裕,因此在收购之后也陷入了困境。为了解决问题,AMD 在 2008 年将与移动设备和技术有关的 ATI 业务打包出售给了高通。
也正是在 ATI Imageon 产品线的基础上,高通骁龙 Adreno GPU 应运而生,这也使得高通成为了 Android 生态中唯一一家能够独立自行研发移动 GPU 架构而无需购买 Arm 公版授权的厂商。
在最新的苹果 A16 芯片上,CPU 和 GPU 提升寥寥,官方用来体现 CPU 性能提升的对比产品还是三年前的 A13,GPU 方面更是被高通最新一代 Adreno 反超一大截。
极客湾的测试结果显示,搭载骁龙 8 Gen 2 的小米 13 在绝大部分频率的能效都明显优于搭载 A16 的 iPhone 14 Pro,以及搭载 A15 的 iPhone 13 Pro。在上一代的 GPU 竞争中,A15 还能占据一定优势,到了 A16 这代几乎完败给了高通 Adreno 740 GPU。
而据 The Information 报道,苹果原计划是对 A16 芯片的 GPU 进行重大升级,引入光追等技术。但在开发过程中,苹果发现存在设计缺陷,会导致严重影响手机续航和发热的问题,最终不得不直接使用 A15 上的 GPU 设计,这也是为什么 A16 GPU 完全没有进步的原因。
3、三星和高通:同一方向,不同目的
如果非要用一个结论概括高通和三星重启自研 CPU 架构的原因,无疑是因为产品不行。更具体地说是,在苹果的对比下,Arm Cortex CPU 不太行,即便是超大核的推出也没有改变现状,高通和三星想要打破各自面临的僵局,只能继续深入核心架构。
但具体到两家公司,还存在较大的区别。在三星这边,核心还是希望重振手机业务。根据 Counterpoint Research 的报告,去年第四季度苹果已经超过三星成为全球第一大智能手机厂商,而同时三星在中国市场也几乎没有挽回之力。
虽然在 Galaxy S23 系列这代选择了全线搭载骁龙 8 Gen 2 芯片,但三星并没有打算放弃自有芯片。在重启自研 CPU 架构之外,三星与 AMD 在移动 GPU 上的合作也没有停止,负责 GPU 开发的三星副总裁 Sungboem Park 明确表示将继续与 AMD 合作。
到去年年底还有消息称,三星将联合 AMD Radeon 团队和谷歌 Tensor 团队,共同开发一款全新的移动 SoC,预计将于 2025 年独占推出。三星电子总裁、MX 业务负责人卢泰文日前也透露,三星电子正在为旗下的 Galaxy 手机产品线研发专属的定制 SoC,并称这款芯片将会是:
不同于市面上的任何其它产品、堪称「独一无二」的存在。
自研芯片核心的好处之一在于对硬件底层的整合,同时掌控产品周期,根据需求定制芯片设计,以及更好地适配软件生态。这既是苹果打造核心体验的关键,也是越来越多手机厂商投入自研芯片的主要动力。而更深层次的自研 CPU/GPU 架构可以在核心差异化方面取得更大的突破。
Garner 研究总监盛陵海也表示:「自研内核可使芯片厂商在进行处理器开发时可以减少对公版设计的依赖,拥有更大的自主性和差异化。」
但受限 Arm 公版架构,高通这几年眼看苹果在 PC、高端手机市场不断扩大优势,自身却没有太多办法。
在 PC 上,得益于 M 系列芯片的低功耗和高性能表现,MacBook 在提升性能表现的同时大幅改善了散热、续航、噪音等多方面的表现,几乎在 PC 寒冬中一骑绝尘,不断拉高了苹果的市场份额。
而在高端手机市场,苹果还在继续巩固其统治地位,去年更是占去了全球份额的四分之三。毫无疑问,Android 阵营冲击高端的举动和骁龙 888 和 8 Gen 1 的糟糕表现相加,不仅没有挑战到苹果,甚至一定程度上加深了消费者在高端市场对苹果的认可。
只是在 A16 这一代遇到了自身的错误(事关移动光追技术支持,详情可看我们之前的报道),再加之高通换到台积电 3nm 工艺+新架构带来的大幅提升,才堪堪被缩小了差距。
不过,更本质的问题并没有被解决,高通想要帮助 Android 阵营拿下更多的高端市场份额,必须拿出能效和性能表现更优异的产品,既然 Arm 公版设计难以满足,只能像自研 Adreno GPU 一样,自己开发 CPU 核心架构。
4、国产芯片的出路
目前,国产CPU按架构类型主要分为ARM、X86、自研三条路线。关于这些架构是否自主可控,外界争论颇多。其实只从架构来源判断是否自主,是陷入表象了。国产CPU的自主可控,要看是否拥有消化、吸收、迭代的能力。
ARM路线:表面繁荣与背后隐忧
近年来,ARM架构在国内市占增长迅速,生态短板也有所补齐。但繁荣背后,仍存在隐忧,根源即是可持续迭代的问题。
ARM授权模式主要为架构许可协议(ALA)和技术许可协议(TLA)。打个比方,ALA相当于买了毛坯房,可基于户型图做硬装软装,TLA相当于买了精装房,只能填些家具物件;但无论毛坯还是精装,都不能擅自改变户型结构。即买了哪个架构版本就是哪个版本,想要迭代升级,只能购买新的架构版本。
ARM这种授权模式,好处是降低技术门槛,国内公司拿来即用,能快速产出高性能CPU;坏消息是,会被死死锁在版本授权的框里,如果通过自主迭代跨越版本红线,那么就会严重侵权。
2021年ARM公司推出了新一代ARM v9架构,受美国禁令影响国内授权遥遥无期。只拿到v8版本授权的国产ARM陷入两难境地,自研无门,引进受限,未来迭代前景不太乐观。
X86路线:技术引进后的再创新
国内X86架构玩家,主要为海光和兆芯。
兆芯的X86授权来源于早年收购的台湾VIA公司。基于X86天然的性能生态优势,兆芯已成功自主研发并量产多款通用处理器产品,行业应用成果突出。
从兆芯KH-4000的测试跑分数据来看,性能大概接近于AMD的EPYC 7601,即第一代的Zen。
海光的X86授权来源AMD,并且还拿到了ZEN1架构的完全授权,技术起点相对较高。因为X86交叉授权的模式,所以无版权风险,迭代方面也没什么限制。
在此基础上,海光3年3款产品的快速迭代。去年发布的海光3号,性能较上代提升40%,从跑分上看也接近AMD的EPYC 7513,即第三代的Zen。
可见,X86阵营的玩家,都在技术引进后实现了消化、吸收以及不同程度的再创新,与国际顶尖产品的代际也相差不多。
自研路线:站在前人肩膀,未来可期
除ARM、X86外,龙芯一直自研的LoongArch架构,其实也是有参考借鉴国外架构技术。
龙芯最早使用的是MIPS架构,2009年获得的授权。后来在MIPS架构经验上,推出了LoongArch架构,相对于MIPS,摒弃了部分不适合现代CPU的指令,又做了部分扩展,相对而言自研程度更深,迭代发展不受人所制。
可惜龙芯的性能偏弱,生态也不够完善,不满足当下商业市场的需要。不过随着龙芯研发进步,相信未来可期。
几条路线背后都有国外技术的影子,因此较真架构授权来源并无必要,可持续发展才是唯一出路。国产CPU还处于发展中阶段,要正视与世界主流的差距,“黑猫白猫,能抓耗子就是好猫”。
如何消化吸收先进技术,创新迭代好用的中国芯,这才是应该要聚焦的事情。