> 财经 >

天天观速讯丨互联网大厂跑马圈地虚拟数字人,千亿市场爆发至少还要等上5年?

时间:2022-10-18 09:39:00       来源:澎湃新闻

听说过洛天依和《甩葱舞》吗?伴随虚拟偶像的出圈,虚拟人产业已经成为资本下注的新目标。

公开数据显示,截至今年9月,国内虚拟数字人赛道投融资金额已超过去年,达到24.9亿元。2021年虚拟数字人相关企业投融资金额约为19.71亿元,而在2015年这一统计数字仅为0.33亿元,6年间复合增长率达到97.71%。

各大科技巨头也不约而同选择在虚拟人领域“秀肌肉”:国外的Meta、微软,国内的腾讯、阿里、百度、快手、网易,均投入重金布局。


【资料图】

除了虚拟偶像之外,虚拟人目前已在多个场景有落地应用。“虚拟人的价值不仅仅是‘不塌房’的虚拟偶像。”顺为资本副总裁冯铮告诉澎湃新闻记者。“虚拟人最大的应用场景是虚拟身份和交互界面:前者是虚拟世界中的个人形象;后者相当于虚拟世界中的机器人,由AI驱动,和人类交互。”

元宇宙市场像初创期的门户网站

用学术的解释来看虚拟人,指的是通过CG、动作捕捉、VR等技术,以图片、视频、直播等形式存在于非物理世界,具有拟人化特征的虚拟形象,也可称为数字人。

Unity中国平台技术总监杨栋告诉澎湃新闻记者,虚拟人技术发展已有较长时间。之所以在今年备受关注,一是由于柳夜熙、洛天依等娱乐化虚拟人形象的出圈,二是“元宇宙”概念的兴起。定制个人虚拟形象需求的不断扩大,让虚拟人产业逐渐走入大众视野。

“虚拟人最初走红是在2017年,随后经历了一段时间的摸索期,在这两年逐渐走向商业化。”冯铮告诉澎湃新闻记者。“元宇宙概念整体虚无飘渺,其中大家接触最多和最了解的就是虚拟数字人,无论是虚拟偶像还是虚拟主播,相对更形象和具体一些,因此受到资本的广泛关注。”

根据艾媒咨询预测,虚拟人带动的国内产业市场规模将在2025年达到6402.7亿元。

虚拟人究竟是怎么造出来的?网易伏羲虚拟交互技术负责人斋藤飞向记者透露,制作一个虚拟人,需要考虑场景、受众、承载虚拟人的硬件平台以及成本投入的上下限,这些限制条件综合决定虚拟人的画风、美术品质标准,并且圈定人设的基本范围,在此基础上再进一步确定角色名字、基本设定、主视觉的设计。

斋藤飞提到,虚拟人制造目前仍是一个复杂的技术体系,需要包括美术(建模师、绑定师、动画师)、开发(客户端开发、技术美术、视效开发)、算法(语音生成、动画驱动)等跨学科、跨领域、跨职能协同。当不同领域围绕同一目标共同前进时,如何高效统筹管理也是一项巨大挑战。

目前,虚拟人分为多个种类,最为大众熟知的是娱乐型虚拟人,其中包括柳夜熙、AYAYI、洛天依等虚拟偶像,她们活跃在社交媒体平台,偶尔会带带货。 第二类是服务型数字人虚拟员工,此外还有一些虚拟数字人作为客服存在。 第三类则是ID型数字人,代表虚拟世界中的某个特定化身,例如虚拟新闻主播等。

“预计虚拟人的商业价值最大化要等5至10年。”冯铮表示,需要人人都有下一代硬件设备,才能像移动互联网那样大规模地影响和改变世界,爆发出产业的最大价值。

在他看来,其实目前虚拟人赛道的企业竞争并不激烈。“可能企业普遍对于短期内挣钱的领域更感兴趣,而虚拟人目前的商业回报不明显,更多是长线布局。”

作为投资方,冯铮坦言,自己对初创企业的技术能力和短期内切入口最为关注。“现在的元宇宙很像1998、1999年时,当时四大门户(网站)、阿里巴巴刚刚创立。今天虚拟世界也有一批有愿景的创业者开始去尝试,而且也吸引到了一批早期用户。在业态迭代的过程中,产品会随着认知、技术、用户甚至硬件的变化不断进化,这些都考验企业的核心技术能力。”

大厂“跑马圈地”,谁能脱颖而出

值得注意的是,虚拟人已成为各大科技巨头共同押注的赛道。

文娱产业分析师张书乐认为,虚拟人某种意义上是互联网大厂展示肌肉的集中呈现物,即内容创造、人工智能、动作捕捉和各种与之相关的技术的融汇。

在腾讯智能产品副总裁李学朝看来,腾讯通过整合ASR(语音识别技术)、NLP(自然语言处理)、语音交互、自然语言理解、图像识别、TTS(语音自动合成)、知识图谱等AI能力,连接腾讯内容和服务生态,面向使用场景打磨平台能力,助力客户打造出有智能、有形象、可交互的数字分身。

“数字人是互联网3.0的重要入口,既是技术对效率的解放,也将推动线上和线下更全面地一体化,进入全真互联。”李学朝认为。

“网易伏羲事业部在2018年就成立虚拟人团队,当时的团队成员是国内最早的虚拟人制造师之一。”网易伏羲AI虚拟人首席专家大丁向记者透露。

如今,虚拟人制造师已经成为炙手可热的工作,不仅涉及AI从业者,也包括工程平台、技术美术,产品经理,项目管理、商务等岗位。

百度自2019年正式进军数字人领域,并主打高度定制化的超写实机器人。百度数字人与机器人业务负责人李士岩告诉记者,虚拟人是技术驱动型的市场,一旦某个技术突破,市场就会迅速展开。“从市场规模来看,预计2030年达到2700亿,在整个产值来看,2022年发生在市场上的产值是大几十亿左右,且预计每年会有超过50%的速度递增。”

在他看来,虚拟人是web3.0以及元宇宙时代的主要内容,也是主要的交互载体。“我们非常看重虚拟人未来应用场景,以及为企业在营销和生产上带来的价值,将来虚拟人会是每个人在元宇宙中的载体和分身,百度会坚定投入,无论是人力上或者资金的投入方面,每年都是百分之几十的速度增长。”

快手也宣布了自己在虚拟人方面的进展。快手Y-tech AI技术中心负责人万鹏飞告诉澎湃新闻记者,“目前快手已经能够提供从建模到最终的内容制作的一站式服务,在全链路上都有深厚的积累。”他透露,数字人和XR是快手发展路径上的重要方向。

10月12日,Meta发布最新数字人成果:用手机扫描即可生成超写实数字化身,根据扎克伯格在发布会视频中的介绍,Meta的最新扫描技术允许在任何正常光源下进行自主扫描,这是突破数字人扫描中空间局限的一次大胆尝试。此外,Meta的科研人员透露,他们仍将致力于缩短处理时间,以进一步提升扫描效率。

制作成本高昂,实时交互是难题

杨栋透露,虚拟人的制作成本非常高,从前期的动作、表情捕捉,到后面的数据处理、渲染,时间成本、人力成本都非常高昂。

“要想降低成本,首先要摸索出一条标准化的制作流程,并且在每一步流程里,提供相应地专业化、标准化工具或解决方案,从而带动整个行业加速发展。”

在他看来,虚拟人真正的难点应该是在实时交互上,现在偏写实或者3D的虚拟人的展现方式其实更多的是视频类型,如果需要做到实时交互,则不仅要依靠画面,还需要语音、智能系统、硬件设备、网络甚至算力的系统配合。产业的发展还需要时间,但是需求和市场都已经存在。

万鹏飞同样提到了实时交互的重要性和难点。“用户需要和环境交互的能力,以及和其他人交互的能力。”他认为,虚拟世界构建的核心仍然是社交关系,而这种关系需要身份系统、环境系统、经济系统等共同构建。这在技术上仍然是一个不小的挑战。

不过,虽然得到业界和资本圈的普遍看好,虚拟人目前的发展仍在早期阶段。张书乐向记者分析,目前虚拟人内容输出依然需要人工完成,即依靠声音库生成而非人工智能角度的虚拟数字人(如洛天依)演绎的大量内容创作者来进行歌曲创作、动作捕捉,而这并不比配合现实艺人的演艺简单。

另外,人工智能向的虚拟数字人,尽管可以进行有效问答,亦可针对特定内容(如高考作文)进行创作,但涉及到认知盲点就不再有效。例如在驾驶过程中,成为车载导航的虚拟数字人进行人机交互的展示意义和智能音箱并无二致,形象呈现也无实际意义。

“仅仅看到营销成本降低,却无视虚拟数字人的研发、维护和升级成本,都是将虚拟人看作是一种低成本营销和蹭热点手段的偏见。”张书乐表示。

网易伏羲产品经理阁语透露,未来技术团队的发展方向主要分为两类:一是致力于打造更生动自然的虚拟人,让其表现趋近于真人;二是如何去实现虚拟人生产和AI能力应用的一个规模化,实现将虚拟人技术高效的应用在各个场景中。

标签: