01引言
数字人技术即将普及化的时代正在迅速来临!
从前年开始,很多品牌主纷纷启用虚拟人作为品牌代言人。请明星不但要承担过高的预算,还有随时可能“塌房”的风险,真人各种不可控的因素让品牌们苦不堪言,于是他们只好转投可以由自己百分百掌控的“数字人”。
而虚拟人爆火的同时,数字人的另一种形态——数字分身也在蔚然成风。这两者的区别简单来说就是“虚拟人”是完全虚构的,直接由计算机生成的,而“数字分身”则是一个真实人物的数字孪生体。
生成式AI技术作为一种利用深度学习模型从数据中学习并生成新的内容的技术,可以根据文本、图像、音频等输入,生成各种类型的输出,如3D模型、视频、动画、音乐、诗歌等。生成式AI技术的进步将为数字人提供了强大的支撑,使其能够适应不同的场景和需求,展现出无限的可能性。这也意味着人们在线交流的形式将彻底发生改变。数字人栩栩如生的外观,生动的表情,再加上AI技术加持下具备“最强大脑”,会为我们营造出逼真的互动性。
每个人可以随便“生产”数字人,甚至拥有自己的数字孪生(兄弟姐妹)的梦幻景象将成为现实,一切都将只是时间问题,甚至在可见的两三年内即可实现。数字人目前最先进的底层技术是什么样?已经在哪些商业场景和行业内有成熟应用?生成式AI将如何赋能数字人的发展?二者的交融会为元宇宙带来哪些新的想象?带着这些问题,我们采访和调研了国内6家代表性数字人服务商的创始团队,他们分别是一知智能、倒映有声、元境科技、拓元智慧、创想数维、宙予科技。本篇内容即是对访谈内容的全面和体系化呈现。
02主流数字人的技术原理和应用
目前国内的数字人技术厂商底层技术主要以NLP(NaturalLanguageProcessing自然语言处理)技术、多模态融合交互(不同形式的输入组合(例如,语音、手势、触摸、凝视等)被称为多模态交互模式,其目标是向用户提供与计算机进行交互的多种选择方式,以支持自然的用户选择。)和大模型(大模型又可以称为FoundationModel(基石)模型,模型通过亿级的语料或者图像进行知识抽取,学习进而生产了亿级参数的大模型。)、XR技术(ExtendedReality扩展现实,是指通过计算机将真实与虚拟相结合,打造一个可人机交互的虚拟环境,这也是AR、VR、MR等多种技术的统称。)这三种技术为底层技术依托打造数字人。
其中NLP技术以创始团队为浙江大学计算机学院人工智能研究所出身的一知智能、上市公司天娱数科战略投资的专门做元宇宙虚拟人相关业务的科技营销公司元境科技两家为典型代表。
一知智能
一知智能CTO李一夫在采访中表示,一知智能创始团队一开始就是研究NLP技术的,目前一知智能的智能客服等产品就是结合一知智能的NLP能力研发的。在持续探索商业化的过程中,一知智能研发团队也在积极
转载请注明:http://www.0431gb208.com/sjszjzl/9366.html