ai写作器人有多大胆，GAN有多高产 | AI创作利器演变全过程

默认分类1年前 (2024)发布 admin

4,545 0 0

赖可发自凹非寺

量子位报道 | 公众号

GAN自从诞生以来，一路升级，功能越来越强。

这种强大的方法走过了怎样的进化之路？

GAN的诞生和构架

GAN诞生在2014年，Ian 和他的同事发表了名为生成性对抗网络 Nets的论文。

GAN的构架从此奠定。

它由生成器和判别器两部分组成，以无人监督的方式运行。

生成器抓取数据并产生新的合成样本，混入原始数据中，一起送给判别器，判别器区分哪些是原始数据，哪些是后来合成的。这一过程反复进行，直到判别器无法以超过50%准确度从合成样本中分辨出真实样本。

在实践中，GAN的构架也带来一些缺陷。

首先，同时训练生成器和判别器与生俱来的不稳定性。每次参数更新后，需要优化的问题性质都会发生变化，因此模型内部的参数值会振荡或不稳定。更严重的情况是，生成器崩溃，吐出一大堆看起来同类的样本。

ai写作器人有多大胆，GAN有多高产 | AI创作利器演变全过程

其次，生成器和判别器还有互相压倒的风险。如果生成器太精确，就会去利用判别器的弱点钻空子，而不是靠生成更逼真的图片来欺骗判别器；如果判别器太精确，就会阻碍生成器的收敛过程。

最后，缺乏训练数据，也会影响到GAN在语义方面的发展，

不过，英特尔AI实验室的高级主管 Tang 表示，正在出现的新兴技术可以应对这些局限。他提出了两种方法，一是将多个判别器放入一个模型中，并根据特定数据进行微调。二是喂给判别器密集的嵌入表示，或者数据的数字表示。这样它们可以有更多的信息，来从中提取。

GAN的应用：从图片到语音

1、图像

GAN最有常见和有名的应用是合成以假乱真的图像。

比如英伟达的Style GAN，可以把人物B的脸部特征迁移到人物A上。

详细介绍可以戳：

除了人脸，还可以进行其它对象之间的迁移。卡内基·梅隆大学的科学家开发了出了-GAN ，它能把一个视频或照片的内容传到另一个上。

比如人脸和动画脸：

或者让一朵花模仿另一朵开的姿势：

ai写作器人有多大胆，GAN有多高产 | AI创作利器演变全过程

2、视频

从图片前进一步，就是视频。开发了DVD-GAN

原始数据集是从上收集的50万张10秒长的高分辨率视频，最终可以生成256 x 256像素视频，最长能有48帧。

3、音乐

除了可以来制作照片，GAN还可以用来作曲。

亚马逊的键盘的原理和GAN一致。

输入一个简单的旋律，生成器根据随机数据创建样本，判别器进行区分。两者反复改进，最终就会生成一段乐曲。

Demo试听可戳：

4、语音

GAN在语音上的应用并不多，谷歌和帝国理工学院的研究者一起研发了GAN-TTS ，这个系统运用GAN，将文本转为自然真实的语音。

这个系统里有10个辨别器，一部分负责判别输出的语音和文本是否一致，另外一部分只关注语音是否真实自然。

# 默认分类 # 判别 # 样本 # 生成 # 视频 # 语音

文章版权归作者所有，未经允许请勿转载。

与ai聊天的软件盘点世界上用的最多的聊天通讯软件，第一名居然不是微信

admin

5,036 0

ai绘画工具【AI绘画】从零开始的AI绘画入门教程——魔法导论【持续更新】

admin

2,544 0

ai绘画生成工具免费 ai作画生成器二次元

admin

2,547 0

ai绘画小程序下载 ai绘画安卓版下载

admin

1,048 0

chatgpt写短视频产品文案如何用ChatGPT自动产出200条爆款短视频

admin

1,553 0

chatgpt使用的是什么算法人工智能算法篇：聚类算法的原理是什么？

admin

4,538 0

暂无评论

暂无评论...

ai写作器人有多大胆，GAN有多高产 | AI创作利器演变全过程

ai智能程序资源：适合 AI 新手的 9 款人工智能开源软件

ai画图工具绘画不靠“笔”靠“算” AI给艺术创作带来更多可能

相关文章

暂无评论

ai写作器 人有多大胆，GAN有多高产 | AI创作利器演变全过程

ai智能程序 资源： 适合 AI 新手的 9 款人工智能开源软件

ai画图 工具 绘画不靠“笔”靠“算” AI给艺术创作带来更多可能

相关文章

暂无评论

ai写作器人有多大胆，GAN有多高产 | AI创作利器演变全过程

ai智能程序资源：适合 AI 新手的 9 款人工智能开源软件

ai画图工具绘画不靠“笔”靠“算” AI给艺术创作带来更多可能