近半年来,ChatGPT 所带来的 AI 热度是大家能直观感受到的。
其实,在不那么直观的地方,数据也在悄然发生变化:斯坦福大学发布的「2023 年 AI 指数报告」显示,2022 年采用 AI 的公司比例自 2017 年以来翻了一番以上。这些公司报告称,采用 AI 之后,它们实现了显著的成本降低和收入增加。
虽然 2023 年的数据还没出来,但仅凭被 ChatGPT 带火的 AIGC 领域就不难推测,上述数字将在今年迎来新的拐点。AIGC 大有掀起第四次产业革命之势。
但与此同时,这些企业在构建 AI 基础设施方面也迎来了新的挑战。
首先,就算力而言,AI 领域 算力需求激增和供给不足形成的矛盾在今年变得尤其激烈 ,就连 OpenAI CEO Sam Altman 都坦言自家公司正被算力短缺问题困扰,其 API 的可靠性和速度问题屡遭投诉。此外,大批公司还面临这波需求高涨带来的算力成本上升问题。
其次,在模型的选择上,不少企业发现,当前讨论热度最高的 大模型其实还没有一个成熟的商业模式 ,其安全性等方面还存在问题。以三星设备解决方案部门为例,他们在启用 ChatGPT 不到一个月的时间内,就发生了三起数据泄露事件,这让原本打算直接调用 OpenAI API 的企业打了退堂鼓。此外,自己训练、部署超大模型同样很劝退:想象一下,仅仅简单地向一个大模型发送一次请求,可能就需要昂贵的 GPU 卡进行独占性的运算,这是很多企业都难以承受的。
不过,话说回来,像 ChatGPT 那样「无所不知」的超大模型真的是企业所必需的吗?
性能与成本的艰难抉择
如果要分析最早应用人工智能提升效益的行业,互联网是绕不开的一个,其典型工作负载 —— 推荐系统、视觉处理、自然语言处理等 —— 的优化都离不开 AI。不过,随着业务量的激增,他们也在性能和成本等层面面临着不同的挑战。
首先看 推荐系统 。
推荐系统在电子商务、社交媒体、音视频流媒体等许多领域都有广泛的应用。以电子商务为例,在每年的 618、双十一等购物高峰,阿里巴巴等头部电商企业都会面临全球庞大客户群发出的数亿实时请求,因此他们希望满足 AI 推理在吞吐量与时延方面的要求,同时又能确保 AI 推理精确性,保证推荐质量。
接下来看 视觉处理。
仅美团一家,我们就能找到智能图片处理、商户入驻证照识别、扫码开单车、扫药盒买药等多个应用场景。AI 已经成为其业务版图中很重要的一部分。不过,随着美团业务与用户量的高速增长,越来越多的应用需要通过视觉 AI 构建智能化流程,美团需要在保证视觉 AI 推理精度的同时,提升视觉 AI 推理的吞吐率,以支撑更多的智能化业务。
最后看 自然语言处理 。
得益于 ChatGPT 带来的热度,自然语言处理正获得前所未有的市场关注与技术追踪。作为国内 NLP 技术研究的先行者,百度已在该领域构建起完整的产品体系与技术组合。ERNIE 3.0 作为其飞桨文心・NLP 大模型的重要组成部分,也在各种 NLP 应用场景,尤其是中文自然语言理解和生成任务中展现出卓越的性能。不过,随着 NLP 在更多行业中实现商业化落地,用户对 ERNIE 3.0 也提出了更多细分需求,例如更高的处理效率和更广泛的部署场景等。
所有这些问题的解决都离不开大规模的基础设施投入,但困扰这些企业的共同问题是: 独立 GPU 虽然可以满足性能所需,但是成本压力较大,因此一味扩充 GPU 规模并不是一个最佳选项 。
CPU也能搞出大模型
AMD在CES上宣布了一系列以AI为核心功能的新芯片。这些产品将人工智能功能与去年早些时候收购Xilinx时获得的技术相结合。
公司XDNA架构中的产品具有适应性,并允许公司将人工智能“从PC扩展到智能终端、边缘设备和云”。她补充说,加速器可以适应应用和功率效率。
同时还宣布该公司正在测试其第一款推理加速器,名为Alveo V70。它基于AMD的XDNA技术,可以插入服务器。
Alveo V70旨在加速视频分析和客户推荐引擎等应用程序。该卡以较小的外形尺寸提供了性能效率。该加速器每秒提供400万亿次人工智能计算性能,支持PCIe 5.0,并消耗75瓦功率。
苏博士声称其Alveo V70在图像分类和物体检测等应用中提供了比英伟达T4 GPU加速器更好的性能。芯片制造商共享模拟到最佳条件的性能数据,以使其芯片优于竞争对手产品。真实世界的性能数字通常与供应商提供的数字非常不同。
AMD正在进行Alveo V70预购,芯片将在今年春季上市。
Alveo V70 AI芯片的核心技术也在AMD最新的笔记本电脑芯片Ryzen 7040中,该芯片在CES上发布。“这是业界第一个集成了专用片上AI引擎的移动x86处理器,我们称之为Ryzen AI。”
Ryzen 7040芯片同时运行四个AI流,每秒提供多达12万亿次操作。该芯片有八个基于Zen 4架构的CPU内核,运行速度高达5.2GHz。该芯片采用台积电的4nm制造工艺制造。这些芯片将用于三月份上市的笔记本电脑。
微软首席产品官Panos Panay表示,用户将能够在Ryzen CPU内部的AI引擎上运行大规模模型,而只需要一小部分功率,在这之前需要GPU功率。例如,在Windows 11上提供的Windows Studio Effects中,Ryzen AI将对视频进行增强,以减少背景模糊、改善肖像、抑制背景噪音和自动设置视频帧。“这些体验每秒需要数万亿次的运算……它们现在可以在AMD的AI引擎上运行,而不会对CPU或GPU造成负担,同时只消耗100毫瓦。”
AI大模型会怎样改变B端企业生态
从高速生成图像和视频到全方位增强客户的体验,生成式AI已经被证明是跨越各个行业的工具。
以下是我们探讨出可能会使企业利用AI实现巨大增长的一些方式。
内容的极大丰富:目前的主流AI模型及其应用,能够让企业快速和高效的创建内容,无论是文章,图片还是视频,从效率和质量上都可以获得相当好的性价比,这有利于率先采用AI的企业在拥挤的市场中脱颖而出。例如善用Stable diffusion生成高质量的图像和图形,能极大的提升企业自身出图的生产效率和质量。自动化创意过程也能极大的节省时间和资源。只需要合理的提示词+预先微调好适合自己企业的模型,企业就可以生成大量的图像和文本,无论这些是用于内部还是用于对客户。
加速自动化: 相当多的软件工程AI可以有效的提升企业的工程能力,提高公司开发人员的效率。copilot这样的ai提供了可靠的自动化支持,降低了企业内部的运营成本。很多补充功能也有利于让没那么经验丰富的工程师获得极大的能力提升。
个性化营销:我们总说要进行个性化营销,但最多也就做到按照有限的客户Tag分类来进行分类营销,并不是完全的个性化。而AI让真正的千人千面形成了可能,提供超级个性化的营销活动。甚至通过分析客户的数据,可以根据用户独特的喜好来创建动态内容,从而优化参与度和转化率,能提高营销投资的回报率。
聊天机器人和虚拟助理:AI支持的聊天机器人和虚拟助理可以对客户的查询提供即时,准确的响应。传统的客服机器人只能应对有限和预设的问题,而且从效果来看越来越低效。而全新的AI智能系统可以“理解”客户的需求并提供个性化的支持,增强客户的服务,减少等待时间,这样可以极大的提升客户的满意度和忠诚度。而还有一点很重要,即完全没有技术背景的员工和团队也可以用ai来构建属于自己的机器人来为自己的团队和客户提供服务,而这些成本会非常低。
更强大的翻译能力:全球经济越来越紧密的如今,语言障碍将会随着AI的发展迅速弱化。企业可以越来越容易的面对全球客户,无论所处的行业是电商,游戏,还是开发。曾经的翻译模式无法很好的融合进业务本身,但生成式AI的速度和能力都远远超过了传统的翻译模式,你的交流甚至不需要预先去选择对方的语言是什么。跨境无缝沟通会让更多的企业更容易的全球化。
信息和网络安全:生成式AI会让信息安全更加快速的响应,通过分析大数据的模式,企业或组织可以迅速检测和防止欺诈、保护敏感信息和数据资产。当然这里会有很大的挑战,但我们有理由相信这已经是一种不可阻挡的趋势。
准确的预测和分析:相比于传统的数据分析系统和数据分析模式,生成式AI所带来的预测分析方面表现更为出色。企业可以利用AI做出准确的市场预测和及时的决策,从而优化供应链管理、库存和需求规划。例如曾经需要月甚至季度才能处理的市场情形,在AI加持下可以提升到天,甚至小时级的突发情况,这极大的提升了很多传统企业的运营效率。
学术研究:有相当多的企业(医疗,科技,工程等)拥有自己的学术研究部门或与大学合作展开的科研项目,诸多学术方面的AI模型会极大的提升科研效率,从而让企业更快的进行研发迭代和市场投放。
以上的每一种方法都是AI可能会给B端带来的助力,一定会有一些企业率先摸索到了AI的正确打开方式从而获得本行业的巨大发展优势。无论是内部流程的简化,还是对客户体验的增强,数据驱动的决策和创新等等,都会提升效率,盈利能力和竞争力。而重要的是,对企业有利的事情同时也对企业服务的客户更有利,无论是更低的成本还是更好的体验,都会再当今快速发展的数字环境中获得竞争优势。