ai数字人直播软件开发一个自己的数字人，FACEGOOD把语音驱动表情技术开源了

默认分类1年前 (2023)发布 admin

1,060 0 0

机器之心专栏

机器之心编辑部

助力 AI 数字人落地，（量子动力）正式开源语音驱动表情技术技术。本文是对该技术的简要概述。

目前，元宇宙热潮下，AI 数字人也开始涉及众多领域，包含文娱、服务、教育、营销等。市面上出现的 AI 数字人包括功能型 AI 数字人，如虚拟助手、虚拟导游、虚拟客服等；陪伴型 AI 数字人，如虚拟伴侣、虚拟家属等；社会型 AI 数字人，如虚拟主播、虚拟偶像、虚拟教师、虚拟医生、虚拟导购等。

浦发银行的首位银行业数字员工「小浦」

虎牙 AI 数字人晚玉

搜狐新闻客户端联合搜狗推出的首个明星「AI 数字人」主播。

ai数字人直播软件开发一个自己的数字人，FACEGOOD把语音驱动表情技术开源了

为了实现虚拟数字人的多域化渗透，让更多 AI 数字人的场景落地，决定将语音驱动口型的算法技术正式开源，这是 AI 虚拟数字人的核心算法，技术开源后将大程度降低 AI 数字人的开发门槛。

项目地址：

项目背景

2019 年，第十届中国国际新媒体短片节组委会和联合发布陆川导演 AI 数字人。

陆川导演 AI 数字人形象

观众可以和 AI 数字陆川面对面互动交流，为观众带来打破虚拟空间和现实空间次元壁的实时实感交流互动体验。为了能达到实时交互的效果，开发了一套数字人实时语音交互系统，实现了语音到表情动画的实时转换。

如今，选择将全套语音驱动表情的技术代码开源，免费提供给广大数字人开发者使用。

技术解读

ai数字人直播软件开发一个自己的数字人，FACEGOOD把语音驱动表情技术开源了

该技术可以将语音实时转换成表情动画。这样做的原因是在现行的产业中，用 BS 去驱动数字形象的动画表情仍是主流，方便动画艺术家对最终动画产出最艺术调整，传输的数据量小，方便动画在不同的数字形象之间进行传递等等。

基于这些实际生产中的需求，对输入和输出数据做了相应的调整，声音数据对应的标签不再是模型动画的点云数据而是模型动画的权重。最终的使用流程如下图 1 所示：

在上面的流程中，主要完成部分，ASR、TTS 由思必驰智能机器人完成。如果你想用自己的声音，或第三方的，ASR、TTS 可以自行进行替换。

当然，部分也可根据自己的喜好进行重新训练，比如你想用自己的声音或其它类型的声音，或者不同于使用的模型绑定作为驱动数据，都可以根据下面提到的流程完成自己专属的动画驱动算法模型训练。

那么这一步的框架是什么样呢？又如何制作自己的训练数据呢？具体如下图 2 所示：

常规的神经网络模型训练大致可以分为三个阶段：数据采集制作、数据预处理和数据模型训练。

最后来看两段效果展示视频：

# 默认分类 # 人工智能 # 开源中国 # 数字人 # 虚拟技术

文章版权归作者所有，未经允许请勿转载。

chatgpt未来不能取代的行业未来HR是否会被AI取代？ChatGPT的回答亮了！

admin

559 0

ai自动剪辑软件 AI全自动剪辑软件免费下载 v9.4 绿色破解版

admin

557 0

adobe的ai软件有什么用处 Adobe 发布了一个 AI 平台 “老师”，让旗下软件 “学聪明”

admin

5,036 0

ChatGPT的伦理挑战与道德考量

hu, bufan

553 43

为什么不能用chatgpt写论文离谱，美国教授用ChatGPT「证实」论文抄袭，半个班学生惨遭挂科

admin

3,042 0

让你清楚ai绘画工具有哪些

admin

4,041 0

暂无评论

暂无评论...

ai数字人直播软件开发一个自己的数字人，FACEGOOD把语音驱动表情技术开源了

ai作文生成器器 AI写作生成器

ai配音免费软件推荐4款短视频后期配音软件，发音自然不生硬！

相关文章

暂无评论

ai数字人直播软件 开发一个自己的数字人，FACEGOOD把语音驱动表情技术开源了

ai作文生成器器 AI写作生成器

ai配音免费软件 推荐4款短视频后期配音软件，发音自然不生硬！

相关文章

暂无评论

ai数字人直播软件开发一个自己的数字人，FACEGOOD把语音驱动表情技术开源了

ai配音免费软件推荐4款短视频后期配音软件，发音自然不生硬！