百度智能云、商汤科技瞄准了AI数字人
与历年高考作文热度居高不下、引发热烈讨论稍显不同,今年除了讨论高考作文题目本身之外,一则关于AI数字人挑战高考作文写作的话题,也吸引了相当一部分的外界关注。据悉,百度AI数字人度晓晓仅需40秒就能根据作文题创作40多篇文章。
显然,早前那些出现在作文中、科幻电影中的数字人已经不再是想象,而是真真切切的来到了我们的生活中。近年来,在多方因素的共同作用下,整个AI数字人行业逐渐进入了发展的“快车道”。
配图来自Canva可画
AI数字人热度正高
据IDC发布的《中国AI数字人市场现状与机会分析,2022》报告显示,中国AI数字人市场规模呈现高速增长趋势,预计到2026年将达到102.4亿元人民币。从内外部环境来看,AI数字人的爆发自有其逻辑。
首先,元宇宙概念的爆火,让被视为关键要素的数字人也乘势而起,逐渐进入了发展新阶段。事实上,数字人并不是什么新兴概念,早在20世纪八十年代就已经出现了将虚拟人物引入到现实世界中的想法,不过受多方因素影响,虚拟人行业的发展较为平缓。现如今,随着诸多科技大厂竞相追逐元宇宙,并试图占据更多的主动权,被看做元宇宙入口的数字人,自然也就成为了众多大厂瞄准的目标,引得不少实力强劲者来此布局。
其次,底层技术的成熟,为AI数字人的落地应用提供了基础。在商汤科技联合CARA共同发布的AI数字人白皮书中,从生产自动化和拟人化两个维度,将数字人的进化历程划分为五个阶段,其中达到L4级时,数字人能够实现部分智能化交互;L5级则能够实现完全智能化交互,而数字人智能化交互程度的加深,则依赖于底层的AI技术的迭代。随着相关核心技术的不断提升,数字人的智能化交互水平也日渐提高,依靠AI驱动的数字人数量逐渐增多。
此外,资本市场的看好,同样为AI数字人行业的发展提供了一臂之力。AI数字人的落地应用需要技术为支撑,而技术的研发也需要大量的时间和资金的投入,资本市场的看好使大量热钱流入AI数字人领域,相当一部分AI数字人厂商,尤其是初创型厂商就能够凭此进行技术研发,推出不同于其他AI数字人厂商的产品及服务。
据天眼查数据不完全统计,2021年全年,数字人相关投资共27笔,融资金额从数百万元人民币到数千万元美元不等,行业的投融资环境得到了持续改善。
百度智能云领先
作为代表性的头部企业,百度早在2019年就发布了“虚拟数字人战略”,并宣布正式进军数字人行业。经历多年的探索,如今的百度已经在AI数字人领域占据了一席之地,并先后推出了度晓晓、希加加等AI数字人。据IDC发布的相关报告显示,百度智能云凭借着在多方面的出色表现,已经居于数字人行业第一梯队。
一方面,百度智能云出色的AI能力,为其推出AI数字人产品提供了底层支持。今年4月,百度发布了《百度人工智能专利白皮书2022》,首次披露了高价值专利成果。其中,2021年百度深度学习专利申请量、自动驾驶专利族数量均排名全球第一;白皮书的另一组数据显示,截至2022年4月,百度全球人工智能专利申请超过了2.2万件。有强大的AI技术实力作为依托,百度也能够推出更加出色的AI数字人产品。
另一方面,百度拥有产业级的知识增强大模型,这为其AI数字人落地提供了助力。以百度所推出的AI数字人度晓晓为例,度晓晓不仅能够在百度APP为用户答疑解惑,与用户进行个性化聊天,写作、编曲、画画也不在话下,而度晓晓之所以能够实现如此多的功能,离不开百度文心大模型的支持。据了解,AI数字人的对话能力,使用的是对话生成大模型—文心PLATO;数字人的画画能力,使用的是文心大模型—跨模态图文生成模型ERNIE-ViLG。
除此之外,百度智能云同时布局服务型数字人和演艺型数字人赛道,拓宽了其AI数字人的应用范围。按照应用场景来划分的话,数字人可分为演艺型数字人和服务型数字人两类,而百度智能云在服务型数字人和演艺型数字人两大赛道均有涉猎。
例如,在演艺型数字人领域,百度智能云打造了央视网虚拟主持人小C、航天局火星车数字人祝融号、百度App代言人龚俊等一系列数字人;在服务型数字人领域,百度智能云与浦发银行联合打造了国内首个金融数字人“小浦”。
商汤科技不容小觑
与百度类似,被并称为“AI四小龙”的商汤科技,在AI数字人领域同样取得了颇为亮眼的成绩。据IDC相关报告显示,从六大维度对11家主流AI数字人企业进行综合评估,可将AI数字人市场分为2-3个梯队,其中百度智能云、商汤科技、小冰公司居于第一梯队。
一来,商汤科技有显著的技术优势。数据显示,从2018年-2021年,商汤科技研发支出分别为8.49亿元、19.16亿元、 24.54亿元以及36.14亿元,占当年营业收入的比重分别为45.8%、63.3%、71.21%以及76.89%。得益于商汤科技在科研领域的持续加码,其在技术方面筑起了很高的壁垒。截至2021年底,商汤科技累计拥有11494件全球专利资产,与2020年底相比增长了96%,其中78%为发明专利。
在数字人领域,商汤科技围绕“拟人化”和“自动化”两大维度,持续进行与数字人相关的AI技术和算法的研发与投入,不断夯实自身AI数字人的生产力底座。据了解,在计算机视觉方面,商汤科技视觉相关的算法模型累计超过30000个;在语音语义理解方面,商汤科技自研并具备了包括语音识别、语义理解、语音合成等多项技术能力。
二来,商汤科技提供企业级AI数字人解决方案,为千行百业赋能。现如今AI数字人不仅仅局限于泛娱乐领域,而是随着技术的不断升级逐渐深入至其他行业,助力企业实现降本增效。基于此,商汤科技面向泛娱乐、商业零售、金融服务、文博文旅等全行业提供企业级的AI数字人解决方案。据悉,商汤AI数字人面向全行业所提供的企业级解决方案,已经落地金融网点、手机银行、购物中心、品牌营销等多个场景。
以商汤科技为宁波银行上海分行打造的AI数字人“小宁”为例,“小宁”不仅能够主动接待前来办理业务的顾客,还能够提供各类业务咨询和服务办理。据了解,目前“小宁”能回答550个以上常见业务问题,以及由此衍生的3000个以上相关业务问题;通过运营管理平台的持续运营优化,每天能够新增50个以上衍生问题。可以说,AI数字人的应用在一定程度上提升网点的服务速度和质量。
AI数字人依旧道阻且长
去年,数字人领域迎来了一波“超生潮”,比如超写实数字人AYAYI、新华社数字记者和全球首位数字航天员“小诤”、AI手语主播等等。这一系列数字人的诞生,从侧面印证了AI数字人已经进入了新的发展阶段,但是AI数字人所面临的挑战却依旧严峻。
一方面,技术仍待提升。毋庸置疑,相较于之前AI技术已经有了长足进步,这也是AI数字人得以诞生发展甚至走入人们生活的根本。但是受技术等多方因素影响,AI数字人距离实现完全智能化交互仍有一段距离。据IDC报告认为,当前的数字人大多处于人大多处于L1-L3阶段,即依赖算法驱动肢体、姿态、口型、表情等,数字人只可执行简单的决策和操作。
另一方面,AI数字人领域的竞争同样不容忽视。在技术成熟、市场需求增长等多方因素的共同作用下,AI数字人市场规模持续扩大,价值也日益显现,AI数字人所蕴含的广大前景也吸引了不少玩家来此布局。
据天眼查数据显示,我国现有“虚拟人”、“数字人”的相关企业38.6万余家,从2017-2021年,5年新增注册企业增速复合增长率近66.3%,其中2021年新增注册企业近18万家,注册企业增速达到了155.2%。尽管各路玩家的竞相涌入能够促进AI数字人行业的发展,但AI数字人厂商所面临的竞争压力也随之水涨船高。
总体来说,AI数字人面临的挑战不少,不过随着百度智能云、商汤科技等实力雄厚的玩家不断探索破局,AI数字人所面临的技术难点、数字人制作周期较长等问题也会被解决。换而言之,AI数字人的未来值得期待。