对口型ai软件这些 AI 算法太强了，我有个大胆的想法！

默认分类1年前 (2024)发布 admin

3,541 0 0

ChatGPT国内版

封图 | CSDN付费下载自视觉中国

好久没有推荐有趣的算法了，今天作者再带大家逛逛「AI 乐园」，看看最近新出了哪些新奇好玩的 AI 算法。

深度估计

不知你有没有发现，最新的视觉技术研究，多了很多 3D 相关的工作。

深度估计就是其中之一。

的最新一项研究，根据视频帧序列，就可以稳定地估计图像的深度。

图像深度信息有了，就可以做很多有意思的视频特效：

「水漫金山」、「漫天飞雪」、「金星环绕」。

论文提出了一种重建单目视频中所有像素密集、几何一致性深度估计算法。

比以往的单目深度估计方法具有更高的精度，同时结果更加稳定。

代码开源，盘它！

项目地址：

AI 技术可以撑起鬼畜视频的一片天。

，算法如其名，Wav 音频转嘴唇 Lip。

就是字面的意思，给算法一个音频文件，算法可以让视频里的人物，将这段话自然地念出来。

对口型ai软件这些 AI 算法太强了，我有个大胆的想法！

任何人物身份，甚至包括卡通人物，任何语音和语言，都可以将口型视频高精度同步到任何目标语音。

这位老哥甚至还为小白量身打造了网页 Demo，上传音频和视频就可以体验。

网页地址：

对于有一定编程基础的，可以去下载源代码，只要有你想鬼畜的人的照片或者视频，再输入一段文字，就能合成你想要的视频了。

比如来一段「特朗普热爱中国宣言」，是不是就突然来了灵感。

天啊，我脑海里浮现了好多大胆的想法。

有个还不算完，还有个。

我们可以理解为 AI “读唇术”。

视频的声音没了，帮你生成。

根据画面嘴唇的动作，进行“读唇”，给你音频结果。

值得注意的是，和 B站那些机械风格的鬼畜调音不一样。

这个 AI 效果炸裂，你几乎感觉不到是机器配音，就像人类在发言一样。

算法原理就是根据面部特征，对唇部进行编码，再使用 LSTM 进行音频合成。

和都有开源代码。

来吧，翻牌子，喜欢哪个点哪个。

项目地址：

对口型ai软件这些 AI 算法太强了，我有个大胆的想法！

项目地址：

HiFiC

没做过网站的朋友可能不知道。

图片的大小，太影响网页的加载速度了。

过多过大的图片，可能让你的页面加载，就像老太太吃硬饼一样，得慢慢磨。

还在为图像加载犯愁吗？

最新的好消息是，谷歌团队采用了一种 GANs 与基于神经网络的压缩算法相结合的图像压缩方式HiFiC，在码率高度压缩的情况下，仍能对图像高保真还原。

下面是这种算法展现出来的图像与 JPG 格式图像的对比。

左边是 HiFiC 算法压缩效果，右边是同等体积 JPG 格式图片的效果。

可以非常明显地看到，HiFiC 算法压缩的图片要清晰太多了。

代码还没有开源，但是作者老哥说「快了，快了，这次一定！」

想要体验的小伙伴，直接网页走起！

项目地址：

更多精彩推荐

# 默认分类 # 压缩 # 图像 # 深度 # 算法 # 视频

© 版权声明

文章版权归作者所有，未经允许请勿转载。

广告也精彩

相关文章

如何开发chatgpt 插件 ChatGPT 插件系统，正式上线！

admin

51 0

智能ai画图软件 AI绘图你也行，stable diffusion小白上手攻略

admin

4,589 0

ai平滑工具在哪前端AI实战——告诉世界前端也能做AI

admin

2,535 0

ai变脸软件是什么软件视频“变脸”相似度达80%！“AI换脸诈骗”如何防范？

admin

3,049 0

对口型ai软件 360智脑大模型官宣发布与其他大模型有何区别？记者实测

admin

2,050 0

如何使用chatgpt 读取pdf LangChain+ChatGPT三分钟实现基于pdf等文档问答应用

admin

2,055 0

暂无评论

暂无评论...

323AI导航网（323ai.com）—— 精选全球实用AIGC工具箱。 AI人工智能爱好者使用学习必备导航网站，收录了国内外5000+优质AI实用工具网址，一个专业、全面、实用的AIGC工具与AI资讯导航网站，我们聚焦于最新的AI文本、AI绘画、AI视频、ChatGPT、Stable-Diffusion、Midjourney等AI项目，帮助用户发现最前沿的AIGC项目，探索人工智能的无限可能。

友链申请免责声明广告合作关于我们

Copyright © 2025 323AI导航网陕ICP备2023007327号-3