AI语音是人工智能的重要方向,也是各类智能家电设备最直接、最便捷的交互方式之一。
最近,芯八哥“走进产业链”栏目记者采访了国内智能语音的领先企业——启英泰伦的创始人兼CEO何云鹏,探讨在AIoT时代智能语音高速发展的背景下,当前启英泰伦企业的发展情况以及对行业未来发展的展望。
累计装机量突破2000万台,在美的、海尔等一线家电品牌的覆盖率已经达到80%以上
据了解,启英泰伦成立于2015年,是一家专注于人工智能语音芯片及配套应用解决方案的专精特新企业。
经过多年的发展,目前在智能家居、智能家电、智慧照明等领域,采用启英泰伦智能语音芯片或方案的直接客户已经超过5000家,累计装机量已经突破2000万台,在美的、海尔、海信、公牛等一线家电品牌的覆盖率已经达到80%以上,芯片销售成绩突出。
启英泰伦产品主要应用场景
资料来源:启英泰伦
目前,家庭里面各种各样的设备都处于从传统的功能化往智能化方向演变的一个阶段。在这个阶段,传统的遥控器、按键、或者遥控器/按键组合的方式,已经很难帮助智能设备去表达更丰富的功能,而更自然、更便捷的人机交互方式则可以让这些设备的智能化功能够更好的发挥出来。
何云鹏介绍道,面对智能化升级巨大的市场机遇,启英泰伦以家庭场景作为切入点,以端侧语音交互作为突破口,专注于AI语音芯片及解决方案的研发和销售,经过前几年的铺垫,公司已经步入发展快车道,今年销售有望突破1亿元。
启英泰伦产品主要应用品类
资料来源:启英泰伦
在智能语音芯片方面,启英泰伦自成立以来相继推出了CI100X、CI110X、CI130X、CI131X和CI230X三代系列产品,可广泛应用于智能家电、智能家居等对人机交互有大量需求的领域。
作为公司第一代深度神经网络语音AI芯片,CI1006于2016年推出。在性能上,CI1006可存储500+本地命令词条,具有10米左右全方位唤醒、命令识别反应速度0.2s、识别率高达98%等技术特点。
在首款芯片大获成功之后,公司紧接着进行下一代产品的研发,并于2019年推出了行业首款降噪识别一体语音AI芯片CI110X系列(CI1102/CI1103)产品。
相较于第一代产品,CI110X系列产品集成更多、性能更强、功耗更低,可以实现“云+端”语音识别方案。具体来看,在架构上,CI110X系列芯片基于NPU+MCU架构设计,内置升级的BNPU v2,并新增了语音加速传感器;性能方面,该系列芯片内置高性能低功耗Audio Codec模块和硬件音频处理模块,可以外接麦克风实现单芯片远场降噪和回声消除等功能;落地应用方面,CI110X 系列最低功耗仅需35mW,可广泛应用于低成本、低功耗的设备上,也可应用于智能音箱等需要获取云端内容的设备中。
启英泰伦主要芯片产品
资料来源:启英泰伦
在前两代产品的基础上,2022年启英泰伦又马不停蹄的发布了第三代智能语音芯片,包括CI130X、CI131X和CI230X两大系列。
其中,CI130X系列支持单麦和麦阵语音增强、噪声抑制、回声消除、低功耗唤醒、本地语义理解、声纹识别等语音算法,并首创离线NLP(自然语言处理)和命令词自学习技术,可以让设备在离线状态下具备多轮对话、意图理解、自主学习的功能;而CI230X系列是集“语音+WIFI+BLE”于一体的三合一AIoT芯片,且仅需少量电阻电容等外围器件就可以实现各类智能语音离在线产品硬件方案,性价比极高。
上市之后,第三代产品凭借其出色的性能及语音识别能力,获得了美的、海尔、格力等大客户的一致好评,目前月销量已达百万级别,居于离线语音芯片市场销售前列。
六年时间,三次大迭代,在解决行业需求痛点的同时,也为智能语音产品走进千家万户奠定了夯实的基础。
在谈及产品的迭代方向时,何云鹏指出:公司是围绕技术平台来迭代的,其中最核心的一个技术就是脑神经网络处理器,我们内部也称为BNPU。从2016年的BNPU1.0版本,到现在的 BNPU 3.0版本,在每一代技术平台的基础上,我们在产品路线上又迭代了两个小代,因此截至目前,公司差不多有6代相关的智能语音产品已经推向市场。
启英泰伦完整语音算法链条
资料来源:启英泰伦
经过不断迭代,解决了两个核心问题。何云鹏接着补充道,
第一是性能不断得到提升。现在公司产品在安静的情况下,识别率已经高达99%。更重要的是,通过语音降噪、双麦克风处理降噪、深度学习通话降噪等噪音技术处理后,即使面对油烟机、浴室、风扇等区域内各种各样的噪声环境,识别率也能保持在非常高的水平之上;第二是成本不断降低。从最初100块钱左右的方案成本,发展至今现在成本降低到了不到10块钱,已经达到一个在全社会可以全面普及应用的程度了。
打造“芯片+算法+方案+平台”的完整闭环,以满足客户差异化的需求
智能语音应用领域非常广,本质是一个碎片化的应用市场,因此每家客户的需求都不一样。
在早期,由于行业内没有一个可供参考的开发平台的概念,客户做应用开发的时候就需要内部技术支持团队花上几个月的时间去支持一个项目,这样研发和销售效率就很差,并且一年下来也做不了多少项目。这种情况下要养活公司,要么只能收开发费用,要么就是只能把售价定的很高,但这并不适合智能语音产品的大规模销售与普及。
我们很早就看到了这些行业痛点,为了满足客户差异化的开发需求,公司早在2017年就已经在着手开发智能语音AI平台,在2018年测试完成后,于2019年向全社会发布。有了这个开发平台后,客户只需要具备一点编程的基础,针对于不同产品、不同的逻辑协议都可以快速实现零代码语音识别应用的开发,这样就大大提升了客户的开发效率和便捷度,也使得我们能够同时满足几千家客户的一个需求。
在谈及为何要做解决方案平台时,何云鹏说道。
发展至今,启英泰伦AI平台已经更新到V3.0版本,新增了第三方API接口、离线工具,向开发者开放了更多权限和功能,进一步解决了语音交互技术难点。开发者只需输入文本或选择应用参数,1分钟即可自动生成语言模型,10分钟即可生成可直接量产的固件,实现真正的简单、高效、低门槛,极大缩短了客户产品上市的周期。据公司披露,截至目前该平台已服务客户超过5000家,赋能个人开发者超过10万人,实现了对300多个应用领域的覆盖。
启英泰伦AI平台发展情况
资料来源:启英泰伦
而在算法方面,启英泰伦通过自研语音算法,在掌握传统语音信号处理技术的基础上,首创双麦深度人声分离、端侧NLP、单麦深度学习降噪、命令词自学习4项行业核心技术,极大提高了语音识别的准确性和自然性。
值得注意的是,为了增加产品的附加价值,更好的满足客户差异化的需求,启英泰伦目前主要采用芯片产品+解决方案一起打包出售给客户的模式来实现盈利。
具体来看,启英泰伦目前已经具有离线语音方案、离线语音+蓝牙+通话方案、离线+在线语音识别方案、离线语音+IoT方案等多种智能语音方案的开发能力。
启英泰伦“离线语音+loT”方案
资料来源:启英泰伦
以“离线语音+loT”方案为例,该方案采用启英泰伦最新推出的三代智能语音芯片CI230X系列,集成WIFI和BLE的Combo功能,现已融合涂鸦云、腾讯云小微、腾讯连连、中移物联等IoT平台,用户可以很便捷地进行设备的离线语音控制、手机App/小程序双控和场景联动,以实现IoT、云内容、语音交互的自然融合。
专注于家居家电专用市场,是终端离线智能语音行业的先驱者和领导者
作为人工智能应用最成熟的技术之一,凡是需要人机交互的领域,都可以采用智能语音芯片升级原来的控制交互方式,因此智能语音在近年来的智能化转型中得到了快速的发展。
根据中国智能语音产业发展高峰论坛近日披露的数据,2022年全球智能语音产业规模将达351.2亿美元,保持33.1%的高速增长;从我国来看,根据沙利文的统计数据,2022年我国智能语音市场将达356.8亿元,同比增长18.30%,整体呈积极向好的发展态势。
资料来源:沙利文咨询
从竞争格局来看,国内外智能语音市场均已相对集中,在通用市场上Nuance、谷歌、苹果、科大讯飞、百度等企业占据着主要份额。而在专用市场上,我国的云知声、思必驰、启英泰伦等企业则致力于抢占家居、车载等细分赛道。
对于当下行业发展的现状,何云鹏表示:随着智能语音在应用场景上范围不断被拓展,市场空间越来越大。即使在当前消费电子不景气的状况下,智能语音的需求依然呈高速增长的一个发展态势。不过,行业在正向发展的同时,目前市场高低端分化也越来越大。在中高端市场,相关厂商由于具备词条数多、识别效果好、降噪性能及抗噪性能优等技术优势,在市场竞争中逐渐与其他厂商拉开身位,这其中以启英泰伦为代表;而在低端市场,智能语音芯片命令词较少,只有在特别安静的环境下才能做简单的识别,由于技术壁垒低,那么这些厂商可能会面临比较大的价格战压力而逐渐退出市场。
谈及智能语音,科大讯飞是行业内绕不开的一个话题。作为我国当前智能语音领域的千亿市值龙头企业,科大讯飞已经在工业、汽车、教育、医疗等领域实现了全面布局。
何云鹏指出:科大讯飞专注于通用市场,以云端应用为主,他们的特点体现在算法+云端应用上面。而我们专注于家电等专用市场,以终端应用为主,是行业内首批把智能语音做在终端上面并且能够支持离线运行的公司,可以说是终端智能语音行业的先驱者和领导者,大家专注点不同,各有优势。此外,我们还是 ‘芯片+算法+方案+平台’的全栈式企业,拥有清晰稳定的芯片迭代的规划,并且在市场上已经积累出了非常好的口碑,这是我们区别于科大讯飞等竞争对手的核心优势所在。
当前,行业内处理智能语音有多种方式,常见的有在线语音、离线语音等分类。因为智能语音处理需要用到算力,所以刚开始都是用云端服务器提供算力来进行语音识别和语义处理。
在云端上处理有三个问题,第一个它没有办法去完全解决信号延迟、卡顿的问题;第二个就是它会实时的把用户家庭里面的数据往云端传,所以存在一定的隐私问题;第三个问题是因为它是实时的传输,所有的数据都是放在云端上计算的,意味着它的费用很高,要交很高的云平台年费,这样对于用户来说就非常不经济。
何云鹏分析道,那我们通过技术创新,用离线语音的方式去做技术处理,就能很好的以低成本的方式实现数据的安全稳定,并且能够保护用户隐私,从而有利于推动智能语音在各个领域的普及。我们第一代产品CI1006推出后,逐步开启了智能语音行业离线控制家电的浪潮,以此奠定了启英泰伦在离线语音家电领域的领先地位。
尽管当下面临消费电子低迷、人口负增长等多种不利环境,但这丝毫没有影响人类社会对智能化升级浪潮的发展,尤其在家电领域,拥有交互功能的产品已经成为终端厂商提升价值量的核心卖点。
六年时间,完成三次大迭代,三次小迭代。启英泰伦产品在不断提升性能的同时,成本和功耗也在快速下降。随着公司第三代主力产品的逐步放量,启英泰伦在智能化升级的浪潮中显然已经进入发展的快车道。