在刚收官的杭州亚运会上,跨越钱塘江、点燃圣火的数字火炬人让人印象深刻,而这不是虚拟数字人第一次“出圈”。2022年,柳夜熙、AYAYI等身份型数字人伴随着“元宇宙”风潮而来,吸粉无数的同时也成为品牌方的新宠。如今,服务型数字人也开始发力,同时AI技术对数字人的降本增效效果明显。
用技术把直播间变“直播车间”
按照业务场景的不同,虚拟数字人主要分为身份型、服务型两大类。
其中,身份型数字人具有身份性,多以虚拟的IP或者偶像呈现,主要应用于影视、文娱、市场营销等场景。去年“出圈”的柳夜熙、AYAYI等就是典型身份型数字人,而近日因亚运而大火的数字火炬手“弄潮儿”,后续也将作为一个IP留存。
服务型虚拟数字人是一种具有人工智能技术的虚拟角色,可以模拟真实人类的语言、行为和情感,为用户提供各种服务,主要应用于各行业的服务场景。
无论是身份型还是服务型,虚拟数字人已得到广泛的重视和关注。今年9月初,工信部等5部门印发《元宇宙产业创新发展三年行动计划(2023-2025年)》中,明确提到数字人讲解、数字人客服等内容。
根据《经济日报》报道称,目前我国主播账号近1.4亿,其中虚拟主播占比高达40%。虚拟主播受到热捧,一个重要的原因就是优秀主播非常稀缺。2021年中国直播人才缺口为800万人,这一数字预计在2025年将增至1941.5万人。在巨大的人才缺口下,虚拟主播被视为填补角色的最佳选择。
值得一提的是,知名商业博主、大V刘润在年度演讲中公开表示,自己从2022年10月起,就开始不断用数字人来完成账号的视频演讲。据悉,这些视频的制作方之一是南京硅基智能科技有限公司(以下简称“硅基智能”)。
据硅基智能介绍,他们早在2019年就推出了AI数字人。今年5月,硅基智能发布了“炎帝大模型”,支持自动生成短视频、数字人直播、数字永生、数字文娱等。另据企业介绍,硅基智能已“克隆”了40万硅基数字人分身,包括刘润、江南春等国内商界名人。同时,硅基智能还与欧莱雅、花西子等品牌达成了电商合作,日均帮助完成5万场数字人直播。
“目前,我们在数字人市场上的占有率已达到八成以上。”硅基智能创始人兼董事长司马华鹏告诉南都记者,基于自研的大模型,硅基智能已经和不少电商平台、个人企业、个人品牌合作。在他看来,仅在电商直播赛道上,数字人便已创造了带动百万销售额的成绩。
“我们希望把直播变成更自动化的事情”,司马华鹏对南都记者表示,希望通过数字人技术把“直播间”变成“直播车间”——直播办公室是空荡荡的、鲜有真实的人存在,但随处可见的是正在进行直播的数字人和显示屏。司马华鹏希望未来直播间能摆脱“扯着嗓子在那喊”的模式,“可以把精力集中在产品和服务本身。”
据司马华鹏此前透露,目前公司旗下“炎帝大模型”已经学习了超700TB的真人视频。据他介绍,硅基智能的数字人已经能够根据售卖情况的好坏来改变话术,直播间人气下降时还会通过发福利来挽留受众。同时,硅基智能还和谦寻等直播机构合作,请来一些直播界的名人来不停地训练数字人。
AI深入数字人生成制作
AI无疑是2023年最大的风口。在AI走入千行百业之际,数字人也因AI产生了不少影响。南都记者获悉,AI既可以从制作源头上影响数字人的生成,也可以介入数字人制作的多个流程,实现降本增效。
中国科学院大学人工智能学院教授雷渠江向南都记者表示,AI技术可以通过多种方式增强与数字人的互动,赋予数字人声音甚至个性,使数字人与真人户型在某种程度上具有高度的个性化和自然化。同时,AI可以捕捉、分析和解释用户的声音和语言输入,并使数字人能够及时与人互动,并实现沟通内容的一致和顺畅。
在近日热播剧《异人之下》中,饰演高二壮的是AI数字人演员“厘里”。据创作团队透露,厘里原本是阿里大文娱旗下的超写实数字人,不仅在呈现效果上更趋近于真人拍摄,也实现了剧组在效率和质量上的提升。
在《异人之下》饰演高二壮的是AI数字人演员“厘里”。
据司马华鹏透露,将一个真人视频放进“炎帝大模型”中,大模型会根据文案、时长等要求,推断真人讲话的样子。据他介绍,“炎帝大模型”最初需要“喂”进的视频时长为30分钟,接着是15分钟、5分钟。“最近,只需要‘喂’1分钟的视频,大模型即可生成出一个数字人”。
“我们对数字人的训练时间,原来要一个礼拜,现在基本上就是一天。在降本上,生产的周期越来越短,那它占用我们的机器成本就会越来越低,当它慢慢走向自动化之后,成本会持续下降。”司马华鹏表示,省去了拍摄和剪辑,无需服装、道具、灯光等设备,AI数字人已能为直播行业实现90%以上的降本增效。
是多个虚拟歌手背后的知名厂牌,旗下拥有包括洛天依、言和、乐正绫、乐正龙牙在内的虚拟歌手。哔哩哔哩事业部品牌市场总监黄欢淼告诉南都记者,公司目前已将AI引入到数字人制作的流程中,在她看来,与其他任何行业一样,AI在这其中起到的作用是提高效能。
“以前我们做一个数字人,首先我们要建模,再就是进行骨骼绑定以便在之后做动作捕捉,整个过程中会需要真人演员穿着动捕服来完成。在这之后,我们的技术团队还要对动作数据进行修正,把动作和虚拟的模型绑定再来渲染,才能达到数字人讲话、表演的效果”,黄欢淼介绍在引入AI后,可以先通过语义库的设定去生成模式化动作,“比如谈话场景中,谈话的人会有固定的动作手势,自信的时候会点头,疑问的时候会招手,这些都可以通过动作库去匹配好。”
不过,在黄欢淼看来,数字人内容产出分为高级和中端,而目前仍只是中端层面,“借助AI赋能,在中端内容产出层面可以节省一半甚至以上的时间和金钱成本。”
“一天几十元,就能拥有数字人直播间”
此前,谈及数字人,除了形象吸睛、概念好玩,大众关注更多的是其落地成本问题。
打造了数字人柳夜熙的创壹科技CEO梁子康就曾表示,在推出柳夜熙之前的半年多中,研发、技术、人力等投入就在百万元级别。虚拟人“翎Ling”背后的次世文化创始人陈燕也曾表示,超写实虚拟人的视频每秒的成本在8000元至1.5万元区间,一张图片则要几千元。
柳夜熙。
黄欢淼向南都记者表示,以前应用传统的建模、动捕、渲染等方式来做洛天依等数字人时,三分钟的高清电视演出视频成本就要到数百万元。
不过,伴随着AI技术的应用,虚拟数字人的价格被“打”了下来。硅基智能方面表示,目前已经将数字人的制作成本最低降到了几千块。司马华鹏表示,客户定制的数字人服务中既有一年10万元的,也有一年几千的。“平均下来,中小店家一天最低只需花一二十块,便可获得一个数字人直播间”。
黄欢淼则表示,在数字人制作的不同领域,AI所能达到的提效降本效果也不同。据介绍,在声音方面,AI可以节省90%以上的成本,“以前,需要一个声音表现力比较强的人做配合,现在我们可以直接挑选符合数字人角色的、经过训练的AI声线,这样我们就可以降低成本”。同时,在动作捕捉方面,由于AI技术渗透率的问题,目前可以节约的成本是50%以上。
对于数字人的运维成本方面,黄欢淼也表示,拥有着不同粉丝黏度的数字人IP需要应用不同的运维策略。她观察到业内有不少团队在试点应用全AI的运营方式运维虚拟人,但AI的不可控性毕竟还较高。因此,她提出全AI模式在内容/IP类虚拟人的运维中,如果粉丝对IP的内容不敏感或许还可以应用,但对于像洛天依这类经典数字人IP来说,运用这样的方式风险较大。
【观点】 数字人需求正在增长,更多落地场景或将生成
今年以来,数字人是否已经被催生出了相关新场景?多位受访者向南都记者表示,今年以来数字人并未出现新的应用场景和案例,目前跑出的多个应用场景,皆是因为做到了成本的降低而变得更为普及。
雷渠江发现,数字人最开始在客服、教育、游戏、娱乐等场景中开展应用,如今对数字人的需求正在增长,各个行业也出现了更多的应用。
据中国科学院大学人工智能学院教授雷渠江介绍,在医疗领域,数字人开始在人体测量方面为人类提供数据支持。“在仿真过程中,在数字人软件中加入不同的人体测量数据库,得到目标人群的数字人体模型,比如对老年人和残疾人的建立运动检测数据库数字人模型,依据现实需要通过对老年人或者残疾人进行检测,并与数字人模型进行对比,完善老年人或者残疾人的需求,从而提高服务质量”。
此外,雷渠江表示,数字人目前也在虚拟制造和机械加工模型开展应用,通过建立虚拟环境进行仿真装配、维护和评估。同时,人机协作系统的不断完善,也可以为工厂等制造业降低人工成本。
在司马华鹏看来,数字人刚出现时,就一直主要围绕着短视频直播、内容IP等方向在发展,并没有跑出太多新的领域,目前,数字人直播领域因为降本增效的实现而被广泛应用。
黄欢淼则表示,一个新的场景能否生成落地,应该用经济学的角度去考量,驱动应用场景落地的动力是低成本。“如果某一些技术就是有这个场景,但造价特别贵,那它无法商业化,也无法落地。有一些应用场景,由于一些新科技的赋能能把价格打下来,它就能够落地。”
司马华鹏还表示,在人工智能的赋能下,数字人会将人类从信息互联网逻辑带入服务互联网逻辑。“在银行存钱,可能你要存款达几千万,才会有一个专属的客户经理为你服务。现在数字人可以铺开使用的时候,会不会出现每一个存钱的人在银行都有一个专属的数字人经理的情况?”
采写:南都记者 林文琪