芯片独立、用户和技术需求使然
目前,对于计算场景的应用复杂程度已经倒逼芯片处理性能的提升。
多重负载,尤其是在机器学习方面,芯片性能直接制约了算法的应用。
在很多情况下,芯片定制不仅仅可以把成本降低一个数量级,电量消耗减少到1/10;
并且这些定制化的方案可以给客户以更低的延迟提供更好的服务。
从自研芯片的动机看,一方面是芯片独立的需求,另一方面也来自用户和技术。
从用户角度看,亚马逊云所发布的两款定制芯片,其核心目的并不是为了与传统芯片厂商进行竞争,而是来自用户自下而上的需求:性能和成本。
从技术角度看,非常规芯片正成为算力不断变化和竞争压力下的选择,通用的CPU和GPU难以满足。
与传统芯片厂商相比,云厂商的造芯运动更大优势在于其生态。
如果能充分发挥自己的优势和资源,芯片市场将很有可能被打开一片新的蓝海。
亚马逊AWS逐渐构筑起特有的竞争优势
2006年,AWS发布第一个云服务Amazon S3对象存储,这也是AWS存储的起点。
从2013年推出首颗Nitro1芯片至今,这家最先涉足自研芯片的云厂商,已坐拥网络芯片、服务器芯片、人工智能机器学习自研芯片三条产品线。
亚马逊自2015年初以来就有一个专注于AWS的芯片定制团队,在此之前,AWS与合作伙伴合作构建专业化解决方案。
2019年,AWS发布第二代服务器芯片Graviton,其实例上市后,客户把更多不同的应用方式部署到Graviton上,跨越的范围也进一步扩展。
从定制硬件整机开始,再逐步深入到定制芯片,然后慢慢地把上层的软件、芯片以及硬件整机全方位协同并整合到一起。
从CPU到加速芯片再到存储,这些AWS基础底层技术的进化都是从芯片创新开始的。
4代网络芯片Nitro、3代服务器芯片Graviton、1代AI推理芯片、1代AI训练芯片,这是AWS迄今公布的云计算底座自研芯片版图。
2021年底发布的Graviton3芯片,又把性能和性价比提升了一个新的高度。
Graviton3的性能相比前一代提升了至少25%,功耗降低了高达60%。
该处理器将运行多达64个内核,拥有500亿个晶体管,时钟速度为2.6GHz。
2022年,推出自研通用计算处理器Amazon Graviton3,可为科学计算、机器学习和媒体编码工作负载提供高达2倍的浮点运算性能。
推出自研机器学习训练芯片,基于亚马逊Trainium芯片的计算实例Trn1实例正式发布,可为在Amazon EC2中进行深度学习模型训练以提供最佳性价比和最快的训练速度。
自研芯片成为关键优势
从历史发展的进程来看,x86服务器芯片其实起源于客户端芯片,然后逐渐往里面增加服务器芯片需要的功能。
而亚马逊没有这样的包袱,他们就专注于服务器芯片本身,而且就看准了基于ARM架构的服务器CPU。
经过将近20年的发展,2020年云科技部门虽然收入只占亚马逊总收入的12%,但利润有135亿美元。
也就是说,公司有将近60%的税前利润是由亚马逊云科技提供的。
看向未来十年,自研服务器芯片Graviton将成为AWS的一个关键优势。
Graviton服务器的速度和效率为AWS客户节省了资金,但对服务器的需求如此之大,以至于亚马逊从中产生的收入正在飙升。
截至去年第三季度,2018年底推出的Graviton服务器的收入每年或超过50亿美元。
这意味着,如果Graviton服务器继续增长,2022年,它可能会占亚马逊弹性计算云收入的10%以上。
从技术方面看,亚马逊云科技是全球当之无愧的云计算第一大厂。
根据知名咨询机构Gartner发布的报告,亚马逊云科技已经连续11年在领导力象限排名第一。
在现在看来,亚马逊自研芯片这步棋,走的无比正确。
芯片也帮助他们从一个To C的电商,逐步转型并且颠覆一个To B的行业。
未来走向生态耦合
从技术路线来看,AWS是先纵向[做深根基],再横向[创新突破]。
不过,AWS起步更早,技术广度、成熟度更高,从IaaS、PaaS到SaaS的覆盖范围也更广泛。
生态是云计算与生俱来的特征之一。云生态一般衍生于内部业务,之后再向垂直方面与关联方面整合。
亚马逊从自身电商业务孵化后,通过云平台整合垂直领域企业,在服务链条上聚集的公司足够多的时候,将产业上下游企业关联在一起,实现生态耦合。
目前,亚马逊在云计算上依然有较大的优势,但是竞争压力也在不可避免地增大。
因此,为了盘活整个生态网络,必须在全球建立更多数据中心将算力辐射到更大范围。
公开数据显示,亚马逊2021年研发支出高达560亿美元,营收占比约为12%。
结尾:
未来AWS在数据中心关键芯片还没有的会逐渐补齐,已有的芯片类型后续会持续增强。
过去十年,全球最大云基础设施服务商AWS通过提升技术和降价,在市场保持领先优势。